UMA ABORDAGEM PARA PERSONALIZAÇÃO DE RESULTADOS DE BUSCA NA WEB

Tamanho: px
Começar a partir da página:

Download "UMA ABORDAGEM PARA PERSONALIZAÇÃO DE RESULTADOS DE BUSCA NA WEB"

Transcrição

1 KÉSSIA RITA DA COSTA MARCHI UMA ABORDAGEM PARA PERSONALIZAÇÃO DE RESULTADOS DE BUSCA NA WEB MARINGÁ 2010

2

3 KÉSSIA RITA DA COSTA MARCHI UMA ABORDAGEM PARA PERSONALIZAÇÃO DE RESULTADOS DE BUSCA NA WEB Dissertação apresentada ao Programa de Pós-Graduação em Ciência da Computação da Universidade Estadual de Maringá, como requisito parcial para obtenção do grau de Mestre em Ciência da Computação. Orientador: Prof. Dr. Sérgio Roberto Pereira da Silva Co-Orientador: Profa. Dra. Valéria Delisandra Freltrim MARINGÁ 2010

4 Dados Internacionais de Catalogação na Publicação (CIP) M316a Marchi, Késsia Rita da Costa Abordagem para a personalização de resultados de busca na web, uma / Késsia Rita da Costa Marchi. Maringá: UEM, Orientador: Prof. Dr. Sérgio Roberto P. da Silva Co-orientadora: Profª. Drª. Valéria D. Feltrin Dissertação (mestrado) Universidade Estadual de Maringá, Programa de Pós-Graduação em Ciências da Computação, Ciência da Computação - busca. 2. Personalização resultado de busca na web. 3. Mecanismo de busca - modo de usar I. Universidade Estadual de Maringá II. Título. (21. ed.) CDD: 004 Bibliotecária Responsável Zineide Pereira dos Santos CRB 9/1577

5 KÉSSIA RITA DA COSTA MARCHI UMA ABORDAGEM PARA A PERSONALIZAÇÃO DE RESULTADOS DE BUSCA NA WEB Dissertação apresentada ao Programa de Pós-Graduação em Ciência da Computação da Universidade Estadual de Maringá, como requisito parcial para obtenção do grau de Mestre em Ciência da Computação. Aprovado em 25/02/2010 BANCA EXAMINADORA.

6

7 AGRADECIMENTOS Agradeço primeiramente a Deus, por ter me dado forças para concluir todas as etapas desse curso e, principalmente, concluir este trabalho. Agradeço e dedico este trabalho, a toda a minha família, em especial meus pais, José e Enete, meu marido André, minha filha Gabriela e meus irmãos Katiuce e Tiago, sem o apoio, compreensão, carinho, incentivo e companherismo de vocês a realização deste sonho não seria possível. Ao meu orientador, Prof. Dr. Sérgio Roberto P. da Silva, idealista deste trabalho e a minha co-orientadora, Profa. Dra. Valéria D. Feltrim, pelas orientações, auxílio e confiança em mim depositada. Aos meus eternos amigos de mestrado, e em especial aos meus irmãos de mestrado Roberto Pereira e José Valderlei da Silva (Jesus). Aos meus companheiros de trabalho, Claudete Werner, Wyllian Fressati e em especial à Daniela Eloise Flôr, que sempre me orientou e me ouviu nos momentos difíceis. Agradeço a vocês por todo apoio dado e todas as substituições realizadas ao longo do período de mestrado. Por fim, agradeço a Maira Inês Davanço, secretária do mestrado, por toda a dedicação e atenção dada a todos os alunos diariamente.

8

9 RESUMO O excesso de informação disponível na Web tem requerido dos usuários um maior esforço na recuperação de informação relevante ao seu interesse. Apesar dos motores de busca convencionais possuírem capacidade de retornar resultados de boa qualidade em resposta à maioria das consultas, eles ainda não conseguem oferecer estes resultados de forma eficiente. Neste trabalho é proposta uma arquitetura para um sistema de personalização de busca na Web que emprega a técnica de indexação de semântica latente, adaptada para o ambiente Web, em conjunto com um modelo de usuário construído de forma implícita por meio do acompanhamento da navegação do usuário nos documentos resultantes da busca. Por um lado, a técnica de indexação de semântica latente permite identificar a relação semântica existente entre os websites, proporcionando uma melhor ordenação dos resultados. Por outro, o modelo de usuário proporciona condições de identificar os interesses de um usuário na busca e possibilita uma melhoria na ordenação dos resultados oferecidos de acordo com esse interesse. Para validar esta proposta foram realizadas algumas simulações que comparam a classificação oferecida pelo motor de busca convencional Google com a reclassificação oferecida pelo protótipo desenvolvido. Os resultados dessas simulações apresentaram-se bastante favoráveis, mostrando uma melhor classificação para os documentos considerados relevantes, o que tende a reduzir os esforços empregados pelos usuários na busca de informação relevante. No entanto, o modelo de usuário ainda apresenta alta sensibilidade frente às escolhas de documentos com baixa relevância durante a navegação do usuário. Palavras-Chave: Personalização de Busca na Web, Indexação de Semântica Latente, Modelo de Usuário.

10

11 ABSTRACT The excess of information available on the Web has required a greater effort from users to retrieve information relevant to their interest. Despite conventional search engines possess the ability to retrieve good quality results in response to the majority of users' queries, they are not able to offer these results efficiently. In this work, we propose an architecture for a web search personalization system, employing the technique of latent semantic indexing, adapted to the Web environment, together with a user model built implicitly by monitoring users while they browse among the documents retrieved in the search. In one side, the technique of latent semantic indexing allows the identification of semantic relationship among websites, providing a better ordering of the results. In other side, the user model provides conditions to identify the interest of a user in the search and allows an improvement in the ordering of the results provided according to that interest. To evaluate this proposal, some simulations were carried out comparing the classification offered by conventional search engine Google with the reclassification offered by the prototype developed in our research. The results of these simulations are quite favorable, showing better classification for documents relevant to the user, which tends to reduce the efforts employed by users in finding relevant information. However, the user model stilll has a high sensitivity to the choice of low relevant documents during the user navigation. Keywords: Personalization of Web Search, Latent Semantic Indexing, User Model.

12

13 SUMÁRIO LISTA DE FIGURAS LISTA DE QUADROS E TABELAS LISTA DE EQUAÇÕES LISTA DE ABREVIATURAS E SIGLAS INTRODUÇÃO RECUPERAÇÃO DE INFORMAÇÃO Aspectos Gerais Pré-processamento em Documentos O processo de Tokenização O Processamento de Stopwords O Processo de Stemming Modelos Clássicos Modelo Booleano Modelo Vetorial Modelo Probabilístico Modelos Alternativos O Processo de Indexação de Semântica Latente Decomposição de Valores Singulares Exemplo de aplicação da LSI Recuperação de Informação na Web Aspectos gerais sobre os motores de busca Deficiências dos motores de busca atuais Experimento PERSONALIZAÇÃO DE BUSCA NA WEB A Modelagem do Usuário em Sistemas de Personalização Navegação Adaptativa Abordagens de Personalização na Web Pesquisa contextual Personalização baseada em histórico de consultas Personalização baseada na representação rica das necessidades dos usuários Resultados adaptados por clusterização Personalização baseada em hiperlink:... 86

14 4. ADAPTAÇÃO E PERSONALIZAÇÃO PARA BUSCAS NA WEB A Proposta de um Sistema Adaptativo de Busca Arquitetura do sistema proposto Etapa de pré-processamento Construção do modelo de usuário Adaptação da indexação de semântica latente Personalização dos resultados AVALIAÇÃO DA ARQUITETURA PROPOSTA Metodologia Definindo a Consulta Inicial Aplicando a LSI Aplicando a LSI Adaptada Aplicando o Modelo De Usuário CONCLUSÃO REFERÊNCIAS

15 LISTA DE FIGURAS Figura 1 - Processo básico de Recuperação de Informação Figura 2 - Processo de Tokenização e remoção de Stopwords Figura 3 Posição do primeiro documento relevante classificado pelo Google Figura 4 - Processo de personalização como parte do processo de recuperação Figura 5 Processo de personalização por re-classificação dos resultados obtidos Figura 6 - Processo de personalização por modificação da consulta Figura 7 - Distinção das abordagens de personalização Figura 8 - Arquitetura do Protótipo Figura 9 Proposta de interface Figura 10 - Long tail dos termos utilizados Figura 11- Personalização dos resultados Figura 12 - Processo de Simulação Figura 13 - Ordenação oferecida pelo Google para o primeiro usuário Figura 14 - Ordenação oferecida pelo Google para o segundo usuário Figura 15 - Ordenação oferecida pelo Google para o terceiro usuário Figura 16 Ordenação Google e Protótipo considerando consulta do primeiro usuário Figura 17 - Ordenação Google e Protótipo considerando consulta do segundo usuário Figura 18 - Ordenação Google e Protótipo considerando consulta do terceiro usuário Figura 19 - Gráfico da Comparação Precisão Média dos Retornos Oferecidos Figura 20 - Classificação obtida pelo primeiro usuário utilizando 80% dos termos Figura 21 - Classificação obtida pelo primeiro usuário utilizando 60% dos termos Figura 22 - Classificação obtida pelo primeiro usuário utilizando 40% dos termos Figura 23- Classificação obtida pelo primeiro usuário utilizando 20% dos termos Figura 24 - Classificação obtida pelo primeiro usuário utilizando 10% dos termos Figura 25 Tempo médio de processamento e % de termos utilizados Figura 26 - Precisão Média e % de termos utilizados Figura 27 - Precisão Média e tempo de processamento Figura 28 Ordenação Google e Protótipo considerando a navegação do primeiro usuário. 120 Figura 29 - Classificação obtida a partir de 1 website navegado Figura 30 - Classificação obtida a partir de 3 website navegado Figura 31 - Classificação obtida a partir de 5 website navegado Figura 32 - Classificação obtida a partir de 7 website navegado

16 Figura 33 - Classificação obtida a partir de 9 website navegado Figura 34 - Precisão média considerando a navegação do primeiro usuário Figura 35 - Precisão média considerando a navegação do segundo usuário Figura 36 - Precisão média considerando a navegação do terceiro usuário Figura 37 - Precisão média considerando websites parcialmente relevantes Figura 38 - Precisão média considerando websites irrelevantes

17 LISTA DE QUADROS E TABELAS Tabela 1 - Representação de uma coleção de documentos Tabela 2 - Modelos de Recuperação de Informação Tabela 3 - Coleção de documentos Tabela 4 - Matriz de frequência termo-documento Tabela 5 - Matriz termo-documento normalizada Tabela 6 - Matriz termo-documentos com cálculos TF-IDF Tabela 7 - Coleção de documentos re-ordenada Tabela 8 - Consultas realizadas por usuários Tabela 9 - Número de documentos totalmente relevantes Tabela 10 - Número de documentos com relevância parcial Tabela 11 - Comparação dos retornos obtidos pelos usuários Tabela 12 - Posição dos documentos relevantes Tabela 13 - Abordagens de personalização e forma de obtenção do perfil do usuário Tabela 14 Precisão média da ordenação oferecida pelo motor de busca Tabela 15- Tempo consumido para execução da LSI sem adaptação Tabela 16 - Redução no total de termos Tabela 17 - Precisão Média e Tempo de Execução para o corte de 20% dos termos Tabela 18 - Precisão Média e Tempo de Execução para o corte de 40% dos termos Tabela 19- Precisão Média e Tempo de Execução para o corte de 60% dos termos Tabela 20 - Precisão Média e Tempo de Execução para o corte de 80% dos termos Tabela 21 - Tempo de processamento X Precisão Média Tabela 22 - Precisão média

18

19 LISTA DE EQUAÇÕES Equação 1 - Representação Vetorial de um documento no modelo Espaço-Vetorial Equação 2 - Função de Similaridade Equação 3 Equação para comparação documento-documento Equação 4 Equação para realização do matching entre consulta e documentos Equação 5- Adição de novos documentos Equação 6 - Adição de novos termos Equação 7 - Cálculo da Precisão

20

21 LISTA DE ABREVEATURAS E SIGLAS LSI Latent Semantic Indexing HTML HyperText Markup Language TF Term-Frequency IDF Inverse document frequency SVD Single Value Decomposition HA Hipermídia Adaptativa MOSC Módulo de operações sobre as consultas MOST Módulo de operações sobre o texto MR Módulo de re-ordenação SEO Search Engine Optimization

22

23 23 C a p í t u l o I INTRODUÇÃO Recuperar informações em um contexto aberto, como é o caso da Web, ainda é uma tarefa complexa para os modelos tradicionais de busca de informações, baseados em algoritmos de indexação de conteúdos. A despeito dos softwares atuais de localização de informações, denominados motores de busca, possuirem um grande número de páginas indexadas, sendo capazes de obter resultados de boa qualidade em resposta às consultas dos usuários, os resultados nem sempre vão ao encontro dos reais interesses dos usuários. Em geral, o uso de técnicas de search engine optimization (SEO 1 ) coloca vários website comerciais nas primeiras posições do ranking destes motores de busca, o que pode ser contrário ao interesse de um usuário que está interessado na parte técnica ou artística de um assunto. 1 Os SEOs Search Engine Optimizator, são pessoas ou entidades que realizam trabalhos referentes à otimização de websites. Essa otimização é obtida por meio do posicionamento nos primeiros lugares nas ferramentas de busca para algumas palavras-chaves.

24 24 É neste cenário que os motores de busca convencionais encontram dois grandes desafios. O primeiro diz respeito à qualidade dos resultados, ou seja, como fornecer resultados de qualidade independente do nível de conhecimento sobre a construção de strings de consultas de cada usuário. Mesmo os melhores motores de busca ainda não conseguem retornar uma classificação precisa referente ao contexto de interesse do usuário. Os resultados oferecidos por estes motores de busca misturam websites que são verdadeiramente relevantes ao contexto do usuário com websites que apresentam uma similaridade marginal à consulta, ou que são totalmente irrelevantes. De acordo com MANNING (2008), o número de termos utilizados na elaboração de consultas na Web está em torno de duas ou três palavras-chaves e raramente são utilizados os conectivos booleanos ou caracteres especiais. Esse fato reflete diretamente nos resultados oferecidos pelos motores de busca, que tendem a retornar muitos websites irrelevantes, exigindo que o usuário realize uma filtragem manual dos resultados para obtenção dos que traduzam realmente seu interesse. O esforço empregado nessa filtragem pode ser alto de acordo com a precisão da classificação dos resultados oferecidos pelo motor de busca (HARDTKE, 2009; BRUSILOVSKY, 2009; [B] MICARELLI, 2007; PANT, 2003). O segundo desafio dos motores de busca se relaciona com qualidade da interface com o usuário, ou seja, como atender usuários leigos e/ou profissionais experientes com uma única interface simples. Embora se deseje ter uma interface simples, é interessante que ela possua recursos que facilitem a navegação e, ao mesmo tempo, constituam uma poderosa ferramenta para consultas complexas. Essas interfaces devem ser capazes de apresentar resultados que atendam as necessidades do usuário e exijam desse usuário um mínimo esforço na busca de informação relevante.

25 25 De acordo com KHOPKAR (2003), os motores de busca que têm recursos que possibilitam a interação com o usuário, visando a construção de um modelo de interesses do usuário, apresentam um nível maior de complexidade de interação. Essa interação pode ocorrer de duas formas, sendo por meio: do feedback implícito, no qual as ações do usuário são capturadas de forma não intrusiva; ou do feedback explícito, que requer do usuário uma intervenção direta. Os sistemas que fazem uso do feedback explícito apresentam problemas relacionados a obtenção da informação correta, devido à preocupação com a privacidade ([B] MICARELLI, 2007; PAZZANI, 2007). Softwares como o SurfCanyon (HARDTKE, 2009) utilizam os dois meios de interação, entretanto, usuários leigos apresentam dificuldade de interagir com os recursos adicionais, como os ícones apresentados no final de cada link que possibilita a aproximação de websites similares a esse link. Com o intuito de discutir possíveis melhorias aos problemas referentes aos retornos oferecidos pelos motores de busca convencionais, este trabalho explora ineficiências comuns a estes motores de busca, propondo uma forma de personalização dos resultados oferecidos pelos mesmos de acordo com um modelo de usuário construído de forma implícita, o qual considera as ações do mouse ou do teclado durante a navegação do usuário, possibilitando, assim, identificar o interesse do usuário em cada website. Com a finalidade de apoiar a realização da personalização dos resultados das consultas, foi considerada a hipótese de se criar um modelo de usuário implícito com o uso da técnica de LSI (Latent Semantic Indexing) para auxiliar na indexação semântica dos websites (por meio da identificação de estruturas semânticas ocultas nas relações entre termos e websites) (MANNING, 2008; DEERWESTER, 1996; BAEZA-YATES, 1999). Trabalhos citados por [A] MICARELLI (2007), BRUSILOVSKY (2004, 2009), MANNING (2008), sugerem o uso da LSI em motores de busca no momento da indexação. Neste trabalho, é proposta a aplicação dessa técnica em websites retornados pelos motores de busca

26 26 convencionais e a apresentação de uma nova classificação baseada na similaridade identificada pela LSI no browser do usuário. O modelo de usuário será construído a partir da matriz LSI de cada website visitado. Para tornar viável a utilização da LSI no ambiente web é necessária a realização de adaptações. Com base na lei de Zipf (BRYNJOLFSSON, 2007; KOCH, 2000; ZIPF, 1949) é proposto um corte significativo no número de termos usados na matriz LSI, o que proporciona um maior desempenho e possibilita que as classificações dos resultados das consultas realizadas pelos usuários aconteçam em paralelo à sua navegação. As classificações ocorrem a cada atualização do modelo de usuário e os resultados são re-ordenados por meio do método de visualização personalizada, fazendo uso da ordenação, ou classificação, adaptativa dos links retornados pelo motor de busca. Para validar a utilização da técnica de LSI em conjunto com o modelo de usuário construído de forma implícita, foram realizadas algumas simulações com os resultados obtidos por meio de um protótipo construído e comparados aos resultados obtidos pelo motor de busca Google. As simulações realizadas indicaram a viabilidade de se aplicar o modelo de usuário proposto e a técnica de LSI aplicada a um percentual de termos extraídos de cada documento, na re-ordenação dos resultados oferecidos pelos motores de busca convencionais na Web. Entretanto, é importante salientar que, por se tratar de uma simulação, certos detalhes foram ignorados, como, a não consideração das diferentes taxas de conexões que os usuário utilizam e as questões de interação humano-computador. Esta dissertação está organizada da seguinte forma. No Capítulo II, apresentamos os conceitos relativos a área de recuperação de informação, falando sobre a etapa de préprocessamento de texto realizado nas tarefas de Recuperação de Informação (RI); os modelos clássicos de RI; os modelos alternativos, como a LSI; e o processo de recuperação de informação na Web, citando o funcionamento tradicional dos motores de busca e identificando

27 27 algumas de suas deficiências. No Capítulo III, abordamos os conceitos sobre personalização de busca na Web, enfocando conceitos de adaptatividade, hipermídia adaptativa, modelo de usuário; navegação adaptativa e técnicas de personalização. No Capítulo IV, descrevemos nossa proposta de personalização dos resultados oferecidos pelos motores de busca convencionais utilizando a LSI aplicada a um percentual de termos em conjunto com um modelo de usuário criado de forma implícita. No Capítulo V, detalhamos o processo de simulação realizado e as análises dos resultados obtidos nesse processo. Finalmente, no Capítulo VI, apresentamos nossas conclusões sobre o trabalho desenvolvido, discutimos suas limitações e sugerimos algumas pesquisas futuras.

28

29 29 C a p í t u l o II RECUPERAÇÃO DE INFORMAÇÃO Atarefa de recuperar informações lida com os processos de representação, armazenamento, organização e acesso à informação, objetivando proporcionar ao usuário uma maior facilidade de acesso à informação relevante (BAEZA- YATES, 1999). Neste capítulo, aborda-se o conceito de Recuperação de Informação (RI), sua origem, aplicações e classificação. Apresentam-se ainda as tarefas que ocorrem na etapa de préprocessamento dos documentos, a qual tem como objetivo principal identificar as palavras importantes do texto no contexto ao qual elas pertencem. A seguir são apresentados os

30 30 modelos booleano, vetorial e probabilístico, os quais são considerados clássicos na tarefa de RI. Após essas discussões são citados alguns modelos alternativos de RI e realizada uma explanação sobre o processo de Indexação de Semântica Latente (LSI do Inglês Latent Semantic Index), o qual visa melhorar os resultados oferecidos em tarefas de RI. Por fim, apresenta-se as características inerentes à recuperação de informação na Web, a qual, normalmente, ocorre por meio de motores de busca Aspectos Gerais O termo RI tem sido utilizado desde a década de 40, sendo citado pela primeira vez por Calvin Mooers em sua dissertação de mestrado (MOOERS, 1950). A RI é reconhecida como uma área de pesquisa interdisciplinar, englobando áreas como Ciência da Computação, Arquitetura da Informação, Psicologia Cognitiva, Lingüística, Estatística e outras (GARFIELD, 1977). No princípio, a RI era uma tarefa utilizada apenas por pessoas que trabalhavam em áreas específicas, como bibliotecários, paralegais e pesquisadores em geral. Entretanto, a sobrecarga de informação 2 atual mudou esse cenário. Hoje milhares de pessoas estão engajadas na recuperação de informações quando estão utilizando a Web por meio dos motores de busca disponíveis, ou mesmo na consulta de seus s. Nesse contexto, nota-se que a RI abrange outros tipos de dados que não somente os estruturados como no modelo de banco de dados relacional, fortemente empregado hoje em dia no armazenamento de dados. Dessa forma, estabeleceu-se uma nova necessidade: a consulta em dados semi-estruturados, os quais são caracterizados por possuírem uma estrutura 2 Sobrecarga de Informação é um termo amplamente utilizado para definir a quantidade excessiva de informações disponível na Web (HIMMA, 2007).

31 31 irregular e, muitas vezes, implícita como nos tipos de dados contidos nas páginas HTML (HyperText Markup Language) (MANNING, 2008; PAPAKONSTANTINOU, 1995). Os dados semi-estruturados apresentam uma representação estrutural heterogênea, sendo caracterizados por não possuírem um esquema pré-definido, tendo o esquema de representação presente de forma implícita ou explícita juntamente com os dados, ou seja, eles possuem uma estrutura auto-descritiva. Este tipo de estrutura determina que deve ser feita uma análise dos dados para identificar e extrair a estrutura e os dados que poderão ser utilizados (ELMASRI, 2005). Sistemas de RI são classificados, segundo MANNING (2008), em três escalas. Na escala inicial está a recuperação de informação pessoal, a qual apresenta como objetivo realizar a recuperação de informação em computadores pessoais. Sistemas operacionais como o Windows 7 e Apple s Mac OS X, entre outros, tem integrado a recuperação pessoal de informação. Outros exemplos são os programas de s que fornecem meios para classificações automáticas ou manuais em pastas particulares e filtros anti-spam. Na escala intermediária, encontram-se os sistemas empresariais, institucionais e de busca em um domínio específico, nos quais a recuperação ocorre em uma coleção de dados específica, como em uma determinada base de dados ou em artigos resultantes de uma pesquisa (na qual, normalmente, esses arquivos ficam armazenados em um sistema centralizado). Por fim, na escala mais avançada, tem-se a busca na Web, na qual o sistema realiza a pesquisa na Web e deve ser capaz de trabalhar de forma eficiente, tornando possível que o usuário empregue o menor esforço, e eficaz, produzindo o melhor resultado. A pesquisa realizada deve considerar aspectos particulares da rede, como a exploração de hiperdocumentos e a existência de spamming 3, para a manipulação dos resultados obtidos nos mecanismos de busca. 3 Spamming são técnicas que promovem uma maior exposição do website nos mecanismos de busca, ocasionando resultados insatisfatórios.

32 32 De uma forma geral, sistemas de RI suportam três processos básicos, sendo eles: a representação dos conteúdos dos documentos; a representação das necessidades dos usuários, normalmente indicadas por consultas; e a comparação entre esses dois processos, conforme mostra a figura 1 (CROFT, 1993). Figura 1 - Processo básico de Recuperação de Informação Os documentos são representados por um processo chamado de indexação, o qual gera uma representação formal dos dados de cada documento. Os algoritmos que realizam a indexação variam desde soluções triviais, normalmente utilizadas para indexar documentos de textos completos, até algoritmos mais complexos que armazenam parcialmente o conteúdo dos documentos, geralmente utilizados para grandes coleções. Além dos conteúdos, os índices também guardam informações sobre a localização real de cada documento. Há vários métodos de indexação já desenvolvidos, como o array de sufixos, a assinatura de arquivos e os índices invertidos (HIEMSTRA, 2001). A representação de informações sobre o problema, ilustrada na figura 1, frequentemente é referenciada como o processo de formulação de consultas. Formular uma consulta pode denotar a interação completa entre o sistema e o usuário. Por meio da consulta, o sistema consegue subsídios para começar a entender qual é a necessidade do usuário

33 33 (HIEMSTRA, 2001). Deste modo, a formulação da consulta determina diretamente os resultados oferecidos no processo de comparação. Para formular uma consulta nas ferramentas de busca convencionais pode-se: Fazer uso de termos, ou seja, palavras chaves extraídas da comunicação em linguagem natural, para as quais o mecanismo de busca retornará documentos que possuem esses termos, independentes de sua posição no texto. Ex. information retrieval retornará qualquer documento que possua a palavra information ou retrieval, independente de sua posição. Fazer uso de aspas, que permite definir a sequência exata dos termos, normalmente formando uma frase. Ex. information retrieval retornará documentos que possuem essa sequência de palavras. Fazer uso de conectivos lógicos AND e OR, que determinam a obrigatoriedade ou não do termo no documento. Ex1. information AND retrieval retornará documentos que possuam, obrigatoriamente, os dois termos independentes de posição. Ex2. information OR retrieval retornará documentos que possuam, pelo menos, um dos termos utilizados na consulta. Fazer uso de negação, que permite especificar que a presença de um determinado termo no documento exclua esse documento da lista de retornos, ou seja, consultando por information retrieval serão retornados documentos que possuam o termo information e não possuam o termo retrieval. Escrever consultas que reúnam termos, aspas, conectivos lógicos e negação para explicitar de forma completa a necessidade do usuário. Formulando uma consulta de forma consistente e coerente é possível obter um maior número de documentos relevantes ao interesse do usuário. Quanto mais detalhes forem

34 34 apresentados ao mecanismo de busca no momento da formulação da consulta, mais refinado fica o resultado apresentado por esse mecanismo. O processo de comparação (matching) refere-se a comparar a consulta formulada pelo usuário com os documentos indexados pelo mecanismo de busca. A partir de um conjunto de documentos e uma consulta, o processo de comparação obtém um subconjunto ordenado de documentos relevantes à consulta formulada. Essa ordenação tem como objetivo principal minimizar o tempo que o usuário leva para encontrar documentos interessantes e é estabelecida pelo algoritmo de classificação de cada mecanismo de busca. Esses algoritmos, na sua maioria, utilizam a frequência dos termos e/ou métodos estatísticos para a distribuição desses documentos. Ao navegar nos documentos retornados, o usuário pode obter informações sobre o problema, o que pode auxiliá-lo a melhorar a query e, por conseqüência, obter um maior número de documentos relevantes. Na sua forma convencional, o processo de comparação realizado por motores de busca utiliza simplesmente a recuperação de palavras por semelhança literal, não levando em consideração toda a informação existente no documento ou as interações realizadas pelos usuários. RIJSBERGEN (1999) comenta que esse processo poderia ser realizado por meio do conjunto de palavras pertencentes aos documentos da coleção, fazendo o uso de sinonímia 4. A sinonímia pode causar uma sensível redução no número de documentos retornados relevantes à consulta, devido ao fato de que a palavra-chave que está sendo utilizada na consulta pode não estar sendo utilizada no documento. E, além desse uso, também é possível utilizar informações referentes ao interesse do usuário por meio da sua interação com o sistema. Em uma abordagem de RI, tanto a sinonímia quanto a polissemia 5, são problemas importantes que devem ser tratados na etapa de pré-processamento. A polissemia pode causar retornos de documentos não relevantes ao usuário, pois as palavras-chaves utilizadas na string 4 Sinonímia é um fenômeno que ocorre com palavras diferentes que apresentam o mesmo significado. 5 A polissemia é um fenômeno em que uma palavra possui múltiplos significados.

Organizaçãoe Recuperação de Informação GSI521. Prof. Rodrigo Sanches Miani FACOM/UFU

Organizaçãoe Recuperação de Informação GSI521. Prof. Rodrigo Sanches Miani FACOM/UFU Organizaçãoe Recuperação de Informação GSI521 Prof. Rodrigo Sanches Miani FACOM/UFU Introdução Organização e Recuperação de Informação(GSI521) Tópicos Recuperação de informação (RI); Breve histórico; O

Leia mais

Organizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU

Organizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Organizaçãoe Recuperaçãode Informação GSI521 Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Aula anterior Organização e Recuperação de Informação(GSI521) Modelo vetorial- Definição Para o modelo vetorial, o

Leia mais

Novell. Novell Teaming 1.0. novdocx (pt-br) 6 April 2007 EXPLORAR O PORTLET BEM-VINDO DESCUBRA SEU CAMINHO USANDO O NOVELL TEAMING NAVIGATOR

Novell. Novell Teaming 1.0. novdocx (pt-br) 6 April 2007 EXPLORAR O PORTLET BEM-VINDO DESCUBRA SEU CAMINHO USANDO O NOVELL TEAMING NAVIGATOR Novell Teaming - Guia de início rápido Novell Teaming 1.0 Julho de 2007 INTRODUÇÃO RÁPIDA www.novell.com Novell Teaming O termo Novell Teaming neste documento se aplica a todas as versões do Novell Teaming,

Leia mais

T U T O R I A I S WEB OF SCIENCE TUTORIAL. Biblioteca da Escola de Engenharia da UFRGS. WEB OF SCIENCE - Tutorial

T U T O R I A I S WEB OF SCIENCE TUTORIAL. Biblioteca da Escola de Engenharia da UFRGS. WEB OF SCIENCE - Tutorial T U T O R I A I S WEB OF SCIENCE TUTORIAL Biblioteca da Escola de Engenharia da UFRGS WEB OF SCIENCE - Tutorial O que é? O Web of Science é uma base de dados que disponibiliza acesso a mais de 9.200 títulos

Leia mais

4 Segmentação. 4.1. Algoritmo proposto

4 Segmentação. 4.1. Algoritmo proposto 4 Segmentação Este capítulo apresenta primeiramente o algoritmo proposto para a segmentação do áudio em detalhes. Em seguida, são analisadas as inovações apresentadas. É importante mencionar que as mudanças

Leia mais

Modelo Cascata ou Clássico

Modelo Cascata ou Clássico Modelo Cascata ou Clássico INTRODUÇÃO O modelo clássico ou cascata, que também é conhecido por abordagem top-down, foi proposto por Royce em 1970. Até meados da década de 1980 foi o único modelo com aceitação

Leia mais

Resolução de problemas e desenvolvimento de algoritmos

Resolução de problemas e desenvolvimento de algoritmos SSC0101 - ICC1 Teórica Introdução à Ciência da Computação I Resolução de problemas e desenvolvimento de algoritmos Prof. Vanderlei Bonato Prof. Cláudio Fabiano Motta Toledo Sumário Análise e solução de

Leia mais

ADM041 / EPR806 Sistemas de Informação

ADM041 / EPR806 Sistemas de Informação ADM041 / EPR806 Sistemas de Informação UNIFEI Universidade Federal de Itajubá Prof. Dr. Alexandre Ferreira de Pinho 1 Sistemas de Apoio à Decisão (SAD) Tipos de SAD Orientados por modelos: Criação de diferentes

Leia mais

CAPÍTULO 3 - TIPOS DE DADOS E IDENTIFICADORES

CAPÍTULO 3 - TIPOS DE DADOS E IDENTIFICADORES CAPÍTULO 3 - TIPOS DE DADOS E IDENTIFICADORES 3.1 - IDENTIFICADORES Os objetos que usamos no nosso algoritmo são uma representação simbólica de um valor de dado. Assim, quando executamos a seguinte instrução:

Leia mais

Status. Barra de Título. Barra de Menu. Barra de. Ferramentas Padrão. Caixa de nomes. Barra de. Ferramentas de Formatação. Indicadores de Coluna

Status. Barra de Título. Barra de Menu. Barra de. Ferramentas Padrão. Caixa de nomes. Barra de. Ferramentas de Formatação. Indicadores de Coluna O que é uma planilha eletrônica? É um aplicativo que oferece recursos para manipular dados organizados em tabelas. A partir deles pode-se gerar gráficos facilitando a análise e interpretação dos dados

Leia mais

Para construção dos modelos físicos, será estudado o modelo Relacional como originalmente proposto por Codd.

Para construção dos modelos físicos, será estudado o modelo Relacional como originalmente proposto por Codd. Apresentação Este curso tem como objetivo, oferecer uma noção geral sobre a construção de sistemas de banco de dados. Para isto, é necessário estudar modelos para a construção de projetos lógicos de bancos

Leia mais

Tabela de Símbolos. Análise Semântica A Tabela de Símbolos. Principais Operações. Estrutura da Tabela de Símbolos. Declarações 11/6/2008

Tabela de Símbolos. Análise Semântica A Tabela de Símbolos. Principais Operações. Estrutura da Tabela de Símbolos. Declarações 11/6/2008 Tabela de Símbolos Análise Semântica A Tabela de Símbolos Fabiano Baldo Após a árvore de derivação, a tabela de símbolos é o principal atributo herdado em um compilador. É possível, mas não necessário,

Leia mais

Algoritmos e Programação (Prática) Profa. Andreza Leite andreza.leite@univasf.edu.br

Algoritmos e Programação (Prática) Profa. Andreza Leite andreza.leite@univasf.edu.br (Prática) Profa. Andreza Leite andreza.leite@univasf.edu.br Introdução O computador como ferramenta indispensável: Faz parte das nossas vidas; Por si só não faz nada de útil; Grande capacidade de resolução

Leia mais

GARANTIA DA QUALIDADE DE SOFTWARE

GARANTIA DA QUALIDADE DE SOFTWARE GARANTIA DA QUALIDADE DE SOFTWARE Fonte: http://www.testexpert.com.br/?q=node/669 1 GARANTIA DA QUALIDADE DE SOFTWARE Segundo a NBR ISO 9000:2005, qualidade é o grau no qual um conjunto de características

Leia mais

textos documentos semi-estruturado

textos documentos semi-estruturado 1 Mineração de Textos Os estudos em Aprendizado de Máquina normalmente trabalham com dados estruturados Entretanto, uma grande quantidade de informação é armazenada em textos, que são dados semiestruturados

Leia mais

RECUPERAÇÃO DE DOCUMENTOS TEXTO USANDO MODELOS PROBABILISTICOS ESTENDIDOS

RECUPERAÇÃO DE DOCUMENTOS TEXTO USANDO MODELOS PROBABILISTICOS ESTENDIDOS ISBN 978-85-61091-05-7 Encontro Internacional de Produção Científica Cesumar 27 a 30 de outubro de 2009 RECUPERAÇÃO DE DOCUMENTOS TEXTO USANDO MODELOS PROBABILISTICOS ESTENDIDOS Marcello Erick Bonfim 1

Leia mais

Desenvolvendo uma Arquitetura de Componentes Orientada a Serviço SCA

Desenvolvendo uma Arquitetura de Componentes Orientada a Serviço SCA Desenvolvendo uma Arquitetura de Componentes Orientada a Serviço SCA RESUMO Ricardo Della Libera Marzochi A introdução ao Service Component Architecture (SCA) diz respeito ao estudo dos principais fundamentos

Leia mais

MODELAGEM DE DADOS MODELAGEM DE DADOS. rafaeldiasribeiro.com.br 04/08/2012. Aula 7. Prof. Rafael Dias Ribeiro. M.Sc. @ribeirord

MODELAGEM DE DADOS MODELAGEM DE DADOS. rafaeldiasribeiro.com.br 04/08/2012. Aula 7. Prof. Rafael Dias Ribeiro. M.Sc. @ribeirord MODELAGEM DE DADOS PROF. RAFAEL DIAS RIBEIRO, M.Sc. @ribeirord MODELAGEM DE DADOS Aula 7 Prof. Rafael Dias Ribeiro. M.Sc. @ribeirord 1 Objetivos: Aprender sobre a modelagem lógica dos dados. Conhecer os

Leia mais

ISO/IEC 12207: Gerência de Configuração

ISO/IEC 12207: Gerência de Configuração ISO/IEC 12207: Gerência de Configuração Durante o processo de desenvolvimento de um software, é produzida uma grande quantidade de itens de informação que podem ser alterados durante o processo Para que

Leia mais

Recuperação de Informação

Recuperação de Informação Recuperação de Informação Estrutura de Dados II Mariella Berger 1 Roteiro Tarefas de Recuperação de Informação Modelos de Recuperação de Documentos Modelo Booleano Modelo Espaço Vetorial Recuperação de

Leia mais

1 http://www.google.com

1 http://www.google.com 1 Introdução A computação em grade se caracteriza pelo uso de recursos computacionais distribuídos em várias redes. Os diversos nós contribuem com capacidade de processamento, armazenamento de dados ou

Leia mais

Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Sistema Gerenciador de Banco de Dados

Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Sistema Gerenciador de Banco de Dados Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Um Sistema Gerenciador de Banco de Dados (SGBD) é constituído por um conjunto de dados associados a um conjunto de programas para acesso a esses

Leia mais

Capítulo 3. Avaliação de Desempenho. 3.1 Definição de Desempenho

Capítulo 3. Avaliação de Desempenho. 3.1 Definição de Desempenho 20 Capítulo 3 Avaliação de Desempenho Este capítulo aborda como medir, informar e documentar aspectos relativos ao desempenho de um computador. Além disso, descreve os principais fatores que influenciam

Leia mais

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS VINICIUS DA SILVEIRA SEGALIN FLORIANÓPOLIS OUTUBRO/2013 Sumário

Leia mais

Análise e Desenvolvimento de Sistemas ADS Programação Orientada a Obejeto POO 3º Semestre AULA 03 - INTRODUÇÃO À PROGRAMAÇÃO ORIENTADA A OBJETO (POO)

Análise e Desenvolvimento de Sistemas ADS Programação Orientada a Obejeto POO 3º Semestre AULA 03 - INTRODUÇÃO À PROGRAMAÇÃO ORIENTADA A OBJETO (POO) Análise e Desenvolvimento de Sistemas ADS Programação Orientada a Obejeto POO 3º Semestre AULA 03 - INTRODUÇÃO À PROGRAMAÇÃO ORIENTADA A OBJETO (POO) Parte: 1 Prof. Cristóvão Cunha Objetivos de aprendizagem

Leia mais

PROCESSO DE DESENVOLVIMENTO DE SOFTWARE. Modelos de Processo de Desenvolvimento de Software

PROCESSO DE DESENVOLVIMENTO DE SOFTWARE. Modelos de Processo de Desenvolvimento de Software PROCESSO DE DESENVOLVIMENTO DE SOFTWARE Introdução Modelos de Processo de Desenvolvimento de Software Os modelos de processos de desenvolvimento de software surgiram pela necessidade de dar resposta às

Leia mais

Organizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU

Organizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Organizaçãoe Recuperaçãode Informação GSI521 Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Análisede links Page Rank Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Motivação Suponha que um modelo clássico, como

Leia mais

Na medida em que se cria um produto, o sistema de software, que será usado e mantido, nos aproximamos da engenharia.

Na medida em que se cria um produto, o sistema de software, que será usado e mantido, nos aproximamos da engenharia. 1 Introdução aos Sistemas de Informação 2002 Aula 4 - Desenvolvimento de software e seus paradigmas Paradigmas de Desenvolvimento de Software Pode-se considerar 3 tipos de paradigmas que norteiam a atividade

Leia mais

CONCEITOS INICIAIS. Agenda A diferença entre páginas Web, Home Page e apresentação Web;

CONCEITOS INICIAIS. Agenda A diferença entre páginas Web, Home Page e apresentação Web; CONCEITOS INICIAIS Agenda A diferença entre páginas Web, Home Page e apresentação Web; O que é necessário para se criar páginas para a Web; Navegadores; O que é site, Host, Provedor e Servidor Web; Protocolos.

Leia mais

Módulo 4. Construindo uma solução OLAP

Módulo 4. Construindo uma solução OLAP Módulo 4. Construindo uma solução OLAP Objetivos Diferenciar as diversas formas de armazenamento Compreender o que é e como definir a porcentagem de agregação Conhecer a possibilidade da utilização de

Leia mais

Pós-Graduação em Gerenciamento de Projetos práticas do PMI

Pós-Graduação em Gerenciamento de Projetos práticas do PMI Pós-Graduação em Gerenciamento de Projetos práticas do PMI Planejamento do Gerenciamento das Comunicações (10) e das Partes Interessadas (13) PLANEJAMENTO 2 PLANEJAMENTO Sem 1 Sem 2 Sem 3 Sem 4 Sem 5 ABRIL

Leia mais

Introdução ao EBSCOhost 2.0

Introdução ao EBSCOhost 2.0 Introdução ao EBSCOhost 2.0 Tutorial support.ebsco.com O que é? O EBSCO Host é um poderoso sistema de referência on-line acessível através da Internet, e oferece uma variedade de bases de dados de texto

Leia mais

Introdução aos cálculos de datas

Introdução aos cálculos de datas Page 1 of 7 Windows SharePoint Services Introdução aos cálculos de datas Aplica-se a: Microsoft Office SharePoint Server 2007 Ocultar tudo Você pode usar fórmulas e funções em listas ou bibliotecas para

Leia mais

Conteúdo. Disciplina: INF 02810 Engenharia de Software. Monalessa Perini Barcellos. Centro Tecnológico. Universidade Federal do Espírito Santo

Conteúdo. Disciplina: INF 02810 Engenharia de Software. Monalessa Perini Barcellos. Centro Tecnológico. Universidade Federal do Espírito Santo Universidade Federal do Espírito Santo Centro Tecnológico Departamento de Informática Disciplina: INF 02810 Prof.: (monalessa@inf.ufes.br) Conteúdo 1. Introdução 2. Processo de Software 3. Gerência de

Leia mais

Pesquisa e organização de informação

Pesquisa e organização de informação Pesquisa e organização de informação Capítulo 3 A capacidade e a variedade de dispositivos de armazenamento que qualquer computador atual possui, tornam a pesquisa de informação um desafio cada vez maior

Leia mais

ENGENHARIA DE SOFTWARE I

ENGENHARIA DE SOFTWARE I ENGENHARIA DE SOFTWARE I Prof. Cássio Huggentobler de Costa [cassio.costa@ulbra.br] Twitter: www.twitter.com/cassiocosta_ Agenda da Aula (002) Metodologias de Desenvolvimento de Softwares Métodos Ágeis

Leia mais

Introdução a listas - Windows SharePoint Services - Microsoft Office Online

Introdução a listas - Windows SharePoint Services - Microsoft Office Online Page 1 of 5 Windows SharePoint Services Introdução a listas Ocultar tudo Uma lista é um conjunto de informações que você compartilha com membros da equipe. Por exemplo, você pode criar uma folha de inscrição

Leia mais

04/03/2013. Gerenciamento de Dados e Informação. Recuperação de Dado X Informação. Histórico

04/03/2013. Gerenciamento de Dados e Informação. Recuperação de Dado X Informação. Histórico Recuperação de Dado X Informação Gerenciamento de Dados e Informação Fernando Fonseca Ana Carolina Robson Fidalgo Comparação (matching) Recuperação de Dados Exata Recuperação de Informação Aproximada Dados

Leia mais

Ajuda ao SciEn-Produção 1. 1. O Artigo Científico da Pesquisa Experimental

Ajuda ao SciEn-Produção 1. 1. O Artigo Científico da Pesquisa Experimental Ajuda ao SciEn-Produção 1 Este texto de ajuda contém três partes: a parte 1 indica em linhas gerais o que deve ser esclarecido em cada uma das seções da estrutura de um artigo cientifico relatando uma

Leia mais

Documento Descritivo do Mecanismo de Busca. Preparação do Portal para indexação

Documento Descritivo do Mecanismo de Busca. Preparação do Portal para indexação Documento Descritivo do Mecanismo de Busca Este documento visa esclarecer as regras que serão executadas pelo mecanismo de busca para a recuperação de informações a partir de uma palavra e/ou expressão

Leia mais

DESENVOLVIMENTO DE UM SOFTWARE NA LINGUAGEM R PARA CÁLCULO DE TAMANHOS DE AMOSTRAS NA ÁREA DE SAÚDE

DESENVOLVIMENTO DE UM SOFTWARE NA LINGUAGEM R PARA CÁLCULO DE TAMANHOS DE AMOSTRAS NA ÁREA DE SAÚDE DESENVOLVIMENTO DE UM SOFTWARE NA LINGUAGEM R PARA CÁLCULO DE TAMANHOS DE AMOSTRAS NA ÁREA DE SAÚDE Mariane Alves Gomes da Silva Eliana Zandonade 1. INTRODUÇÃO Um aspecto fundamental de um levantamento

Leia mais

Planejando o aplicativo

Planejando o aplicativo Um aplicativo do Visual FoxPro geralmente inclui um ou mais bancos de dados, um programa principal que configura o ambiente de sistema do aplicativo, além de uma interface com os usuários composta por

Leia mais

Metadados. 1. Introdução. 2. O que são Metadados? 3. O Valor dos Metadados

Metadados. 1. Introdução. 2. O que são Metadados? 3. O Valor dos Metadados 1. Introdução O governo é um dos maiores detentores de recursos da informação. Consequentemente, tem sido o responsável por assegurar que tais recursos estejam agregando valor para os cidadãos, as empresas,

Leia mais

Engenharia de Software III

Engenharia de Software III Engenharia de Software III Casos de uso http://dl.dropbox.com/u/3025380/es3/aula6.pdf (flavio.ceci@unisul.br) 09/09/2010 O que são casos de uso? Um caso de uso procura documentar as ações necessárias,

Leia mais

3 SCS: Sistema de Componentes de Software

3 SCS: Sistema de Componentes de Software 3 SCS: Sistema de Componentes de Software O mecanismo para acompanhamento das chamadas remotas se baseia em informações coletadas durante a execução da aplicação. Para a coleta dessas informações é necessário

Leia mais

Recuperação. Profa. Lillian Alvares Faculdade de Ciência da Informação Universidade de Brasília

Recuperação. Profa. Lillian Alvares Faculdade de Ciência da Informação Universidade de Brasília Recuperação Profa. Lillian Alvares Faculdade de Ciência da Informação Universidade de Brasília 1 2 Contexto Grande quantidade de informações são produzidas e disponibilizadas diariamente Com a elevada

Leia mais

EDITORA FERREIRA MP/RJ_EXERCÍCIOS 01

EDITORA FERREIRA MP/RJ_EXERCÍCIOS 01 EDITORA FERREIRA MP/RJ NCE EXERCÍCIOS 01 GABARITO COMENTADO 01 Ao se arrastar um arquivo da pasta C:\DADOS para a pasta D:\TEXTOS utilizando se o botão esquerdo do mouse no Windows Explorer: (A) o arquivo

Leia mais

DATA WAREHOUSE. Introdução

DATA WAREHOUSE. Introdução DATA WAREHOUSE Introdução O grande crescimento do ambiente de negócios, médias e grandes empresas armazenam também um alto volume de informações, onde que juntamente com a tecnologia da informação, a correta

Leia mais

ADMINISTRAÇÃO DOS RECURSOS DE DADOS

ADMINISTRAÇÃO DOS RECURSOS DE DADOS Capítulo 7 ADMINISTRAÇÃO DOS RECURSOS DE DADOS 7.1 2003 by Prentice Hall OBJETIVOS Por que as empresas sentem dificuldades para descobrir que tipo de informação precisam ter em seus sistemas de informação?

Leia mais

Aula 4 Pseudocódigo Tipos de Dados, Expressões e Variáveis

Aula 4 Pseudocódigo Tipos de Dados, Expressões e Variáveis 1. TIPOS DE DADOS Todo o trabalho realizado por um computador é baseado na manipulação das informações contidas em sua memória. Estas informações podem ser classificadas em dois tipos: As instruções, que

Leia mais

SQL APOSTILA INTRODUÇÃO A LINGUAGEM SQL

SQL APOSTILA INTRODUÇÃO A LINGUAGEM SQL SQL APOSTILA INTRODUÇÃO Uma linguagem de consulta é a linguagem por meio da qual os usuários obtêm informações do banco de dados. Essas linguagens são, tipicamente, de nível mais alto que as linguagens

Leia mais

Algoritmos: Lógica para desenvolvimento de programação de computadores. Autor: José Augusto Manzano. Capítulo 1 Abordagem Contextual

Algoritmos: Lógica para desenvolvimento de programação de computadores. Autor: José Augusto Manzano. Capítulo 1 Abordagem Contextual Algoritmos: Lógica para desenvolvimento de programação de computadores Autor: José Augusto Manzano Capítulo 1 Abordagem Contextual 1.1. Definições Básicas Raciocínio lógico depende de vários fatores para

Leia mais

Nathalie Portugal Vargas

Nathalie Portugal Vargas Nathalie Portugal Vargas 1 Introdução Trabalhos Relacionados Recuperação da Informação com redes ART1 Mineração de Dados com Redes SOM RNA na extração da Informação Filtragem de Informação com Redes Hopfield

Leia mais

Organização e Recuperação da Informação

Organização e Recuperação da Informação GSI024 Organização e Recuperação da Informação Introdução Ilmério Reis da Silva ilmerio@facom.ufu.br www.facom.ufu.br/~ilmerio/ori UFU/FACOM - 2011/1 Arquivo 1a Introdução Porque RI? Problemas da solução

Leia mais

3 Classificação. 3.1. Resumo do algoritmo proposto

3 Classificação. 3.1. Resumo do algoritmo proposto 3 Classificação Este capítulo apresenta primeiramente o algoritmo proposto para a classificação de áudio codificado em MPEG-1 Layer 2 em detalhes. Em seguida, são analisadas as inovações apresentadas.

Leia mais

6 Construção de Cenários

6 Construção de Cenários 6 Construção de Cenários Neste capítulo será mostrada a metodologia utilizada para mensuração dos parâmetros estocásticos (ou incertos) e construção dos cenários com respectivas probabilidades de ocorrência.

Leia mais

UNIVERSIDADE FEDERAL DE SANTA MARIA CENTRO DE TECNOLOGIA AULA 14 PROFª BRUNO CALEGARO

UNIVERSIDADE FEDERAL DE SANTA MARIA CENTRO DE TECNOLOGIA AULA 14 PROFª BRUNO CALEGARO UNIVERSIDADE FEDERAL DE SANTA MARIA CENTRO DE TECNOLOGIA AULA 14 PROFª BRUNO CALEGARO Santa Maria, 01 de Novembro de 2013. Revisão aula passada Projeto de Arquitetura Decisões de projeto de Arquitetura

Leia mais

UNIVERSIDADE FEDERAL DO PARANÁ UFPR Bacharelado em Ciência da Computação

UNIVERSIDADE FEDERAL DO PARANÁ UFPR Bacharelado em Ciência da Computação SOFT DISCIPLINA: Engenharia de software AULA NÚMERO: 08 DATA: / / PROFESSOR: Andrey APRESENTAÇÃO O objetivo desta aula é apresentar e discutir conceitos relacionados a modelos e especificações. Nesta aula

Leia mais

Universidade Federal de Santa Maria Curso de Arquivologia. Disciplina de Banco de Dados Aplicados à Arquivística. Versao 1.

Universidade Federal de Santa Maria Curso de Arquivologia. Disciplina de Banco de Dados Aplicados à Arquivística. Versao 1. Universidade Federal de Santa Maria Curso de Arquivologia Disciplina de Banco de Dados Aplicados à Arquivística Prof. Andre Zanki Cordenonsi Versao 1.0 Março de 2008 Tópicos Abordados Conceitos sobre Banco

Leia mais

)HUUDPHQWDV &RPSXWDFLRQDLV SDUD 6LPXODomR

)HUUDPHQWDV &RPSXWDFLRQDLV SDUD 6LPXODomR 6LPXODomR GH6LVWHPDV )HUUDPHQWDV &RPSXWDFLRQDLV SDUD 6LPXODomR #5,6. Simulador voltado para análise de risco financeiro 3RQWRV IRUWHV Fácil de usar. Funciona integrado a ferramentas já bastante conhecidas,

Leia mais

QFD: Quality Function Deployment QFD: CASA DA QUALIDADE - PASSO A PASSO

QFD: Quality Function Deployment QFD: CASA DA QUALIDADE - PASSO A PASSO QFD: CASA DA QUALIDADE - PASSO A PASSO 1 - INTRODUÇÃO Segundo Akao (1990), QFD é a conversão dos requisitos do consumidor em características de qualidade do produto e o desenvolvimento da qualidade de

Leia mais

Arquitetura dos Sistemas de Informação Distribuídos

Arquitetura dos Sistemas de Informação Distribuídos Arquitetura dos Sistemas de Informação Distribuídos Quando se projeta um sistema cuja utilização é destinada a ser feita em ambientes do mundo real, projeções devem ser feitas para que o sistema possa

Leia mais

Banco de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri. Banco de Dados Processamento e Otimização de Consultas

Banco de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri. Banco de Dados Processamento e Otimização de Consultas Processamento e Otimização de Consultas Banco de Dados Motivação Consulta pode ter sua resposta computada por uma variedade de métodos (geralmente) Usuário (programador) sugere uma estratégia para achar

Leia mais

Introdução aos critérios de consulta. Um critério é semelhante a uma fórmula é uma cadeia de caracteres que pode consistir em

Introdução aos critérios de consulta. Um critério é semelhante a uma fórmula é uma cadeia de caracteres que pode consistir em Material retirado do site Office online. Introdução aos critérios de consulta Um critério é semelhante a uma fórmula é uma cadeia de caracteres que pode consistir em referências de campo, operadores e

Leia mais

O ESPAÇO NULO DE A: RESOLVENDO AX = 0 3.2

O ESPAÇO NULO DE A: RESOLVENDO AX = 0 3.2 3.2 O Espaço Nulo de A: Resolvendo Ax = 0 11 O ESPAÇO NULO DE A: RESOLVENDO AX = 0 3.2 Esta seção trata do espaço de soluções para Ax = 0. A matriz A pode ser quadrada ou retangular. Uma solução imediata

Leia mais

ENGENHARIA DA COMPUTAÇÃO BANCO DE DADOS I CONTEÚDO 5 ABORDAGEM RELACIONAL

ENGENHARIA DA COMPUTAÇÃO BANCO DE DADOS I CONTEÚDO 5 ABORDAGEM RELACIONAL ENGENHARIA DA COMPUTAÇÃO BANCO DE DADOS I CONTEÚDO 5 ABORDAGEM RELACIONAL PROF. MS C. RICARDO ANTONELLO WWW.ANTONELLO.COM.B R PORQUE SER RELACIONAL? Hoje, há um claro predomínio dos SGBD relacionais, principalmente

Leia mais

Orientação a Objetos

Orientação a Objetos 1. Domínio e Aplicação Orientação a Objetos Um domínio é composto pelas entidades, informações e processos relacionados a um determinado contexto. Uma aplicação pode ser desenvolvida para automatizar ou

Leia mais

Sistemas de Informação I

Sistemas de Informação I + Sistemas de Informação I Dimensões de análise dos SI Ricardo de Sousa Britto rbritto@ufpi.edu.br + Introdução n Os sistemas de informação são combinações das formas de trabalho, informações, pessoas

Leia mais

Noções de. Microsoft SQL Server. Microsoft SQL Server

Noções de. Microsoft SQL Server. Microsoft SQL Server Noções de 1 Considerações Iniciais Basicamente existem dois tipos de usuários do SQL Server: Implementadores Administradores 2 1 Implementadores Utilizam o SQL Server para criar e alterar base de dados

Leia mais

Sistemas Distribuídos

Sistemas Distribuídos Sistemas Distribuídos Modelo Cliente-Servidor: Introdução aos tipos de servidores e clientes Prof. MSc. Hugo Souza Iniciando o módulo 03 da primeira unidade, iremos abordar sobre o Modelo Cliente-Servidor

Leia mais

Guia de Especificação de Caso de Uso Metodologia CELEPAR

Guia de Especificação de Caso de Uso Metodologia CELEPAR Guia de Especificação de Caso de Uso Metodologia CELEPAR Agosto 2009 Sumário de Informações do Documento Documento: guiaespecificacaocasouso.odt Número de páginas: 10 Versão Data Mudanças Autor 1.0 09/10/2007

Leia mais

Banco de Dados I. Apresentação (mini-currículo) Conceitos. Disciplina Banco de Dados. Cont... Cont... Edson Thizon (edson@esucri.com.

Banco de Dados I. Apresentação (mini-currículo) Conceitos. Disciplina Banco de Dados. Cont... Cont... Edson Thizon (edson@esucri.com. Sistemas da Informação Banco de Dados I Edson Thizon (edson@esucri.com.br) 2008 Apresentação (mini-currículo) Formação Acadêmica Mestrando em Ciência da Computação (UFSC/ ) Créditos Concluídos. Bacharel

Leia mais

Este documento tem o objetivo de esclarecer alguns procedimentos e definir parâmetros para facilitar o processo.

Este documento tem o objetivo de esclarecer alguns procedimentos e definir parâmetros para facilitar o processo. Prezado Curador, Em dezembro de 2010 o INCT-HVFF (INCT-Herbário Virtual da Flora e dos Fungos) teve um projeto aprovado junto ao CNPq, no âmbito do programa Reflora, cujo objetivo é aumentar a base informacional

Leia mais

Guia de utilização da notação BPMN

Guia de utilização da notação BPMN 1 Guia de utilização da notação BPMN Agosto 2011 2 Sumário de Informações do Documento Documento: Guia_de_utilização_da_notação_BPMN.odt Número de páginas: 31 Versão Data Mudanças Autor 1.0 15/09/11 Criação

Leia mais

PROVA DE NOÇÕES DE MICROINFORMÁTICA

PROVA DE NOÇÕES DE MICROINFORMÁTICA 18 PROVA DE NOÇÕES DE MICROINFORMÁTICA AS QUESTÕES DE 41 A 60 CONSIDERAM O ESQUEMA PADRÃO DE CONFIGURAÇÃO DO SISTEMA OPERACIONAL MICROSOFT WINDOWS ME E DAS FERRAMENTAS MICROSOFT WINDOWS EXPLORER, MICRO-

Leia mais

Semântica para Sharepoint. Busca semântica utilizando ontologias

Semântica para Sharepoint. Busca semântica utilizando ontologias Semântica para Sharepoint Busca semântica utilizando ontologias Índice 1 Introdução... 2 2 Arquitetura... 3 3 Componentes do Produto... 4 3.1 OntoBroker... 4 3.2 OntoStudio... 4 3.3 SemanticCore para SharePoint...

Leia mais

Conceitos de Banco de Dados

Conceitos de Banco de Dados Conceitos de Banco de Dados Autor: Luiz Antonio Junior 1 INTRODUÇÃO Objetivos Introduzir conceitos básicos de Modelo de dados Introduzir conceitos básicos de Banco de dados Capacitar o aluno a construir

Leia mais

Persistência e Banco de Dados em Jogos Digitais

Persistência e Banco de Dados em Jogos Digitais Persistência e Banco de Dados em Jogos Digitais Prof. Marcos Francisco Pereira da Silva Especialista em Engenharia de Software Jogos Digitais - Computação Gráfica 1 Agenda Vantagens de usar a abordagem

Leia mais

TCEnet. Manual Técnico. Responsável Operacional das Entidades

TCEnet. Manual Técnico. Responsável Operacional das Entidades TCEnet Manual Técnico Responsável Operacional das Entidades 1 Índice 1. Introdução... 3 2. Características... 3 3. Papéis dos Envolvidos... 3 4. Utilização do TCEnet... 4 4.1. Geração do e-tcenet... 4

Leia mais

Engenharia de Software: conceitos e aplicações. Prof. Tiago Eugenio de Melo, MSc tiagodemelo@gmail.com

Engenharia de Software: conceitos e aplicações. Prof. Tiago Eugenio de Melo, MSc tiagodemelo@gmail.com Engenharia de Software: conceitos e aplicações Prof. Tiago Eugenio de Melo, MSc tiagodemelo@gmail.com 1 Objetivos da aula Apresentar os conceitos de Engenharia de Software e explicar a sua importância.

Leia mais

Web Design. Prof. Felippe

Web Design. Prof. Felippe Web Design Prof. Felippe 2015 Sobre a disciplina Fornecer ao aluno subsídios para o projeto e desenvolvimento de interfaces de sistemas Web eficientes, amigáveis e intuitivas. Conceitos fundamentais sobre

Leia mais

TECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO - TIC 10º C. Planificação de. Curso Profissional de Técnico de Secretariado

TECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO - TIC 10º C. Planificação de. Curso Profissional de Técnico de Secretariado Escola Básica e Secundária de Velas Planificação de TECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO - TIC Curso Profissional de Técnico de Secretariado 10º C MÓDULO 1 FOLHA DE CÁLCULO Microsoft Excel Conteúdos

Leia mais

MÓDULO 11 ELEMENTOS QUE FAZEM PARTE DO PROJETO DO SISTEMA

MÓDULO 11 ELEMENTOS QUE FAZEM PARTE DO PROJETO DO SISTEMA MÓDULO 11 ELEMENTOS QUE FAZEM PARTE DO PROJETO DO SISTEMA Através dos elementos que fazem parte do projeto do sistema é que podemos determinar quais as partes do sistema que serão atribuídas às quais tipos

Leia mais

Princípios de Design TRADUÇÃO DE TATIANE CRISTINE ARNOLD, DO ARTIGO IBM DESIGN: DESIGN PRINCIPLES CHECKLIST.

Princípios de Design TRADUÇÃO DE TATIANE CRISTINE ARNOLD, DO ARTIGO IBM DESIGN: DESIGN PRINCIPLES CHECKLIST. Princípios de Design TRADUÇÃO DE TATIANE CRISTINE ARNOLD, DO ARTIGO IBM DESIGN: DESIGN PRINCIPLES CHECKLIST. Um software deve ser projetado para simplificar tarefas e criar experiências positivas para

Leia mais

Roteiro. Modelo de Dados Relacional. Processo de Projeto de Banco de Dados. BCC321 - Banco de Dados I. Ementa. Posicionamento.

Roteiro. Modelo de Dados Relacional. Processo de Projeto de Banco de Dados. BCC321 - Banco de Dados I. Ementa. Posicionamento. Roteiro Modelo de Dados Relacional Posicionamento Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br www.decom.ufop.br/luiz Introdução

Leia mais

Dadas a base e a altura de um triangulo, determinar sua área.

Dadas a base e a altura de um triangulo, determinar sua área. Disciplina Lógica de Programação Visual Ana Rita Dutra dos Santos Especialista em Novas Tecnologias aplicadas a Educação Mestranda em Informática aplicada a Educação ana.santos@qi.edu.br Conceitos Preliminares

Leia mais

Bancos de dados distribuídos Prof. Tiago Eugenio de Melo tiagodemelo@gmail.com. http://www.tiagodemelo.info

Bancos de dados distribuídos Prof. Tiago Eugenio de Melo tiagodemelo@gmail.com. http://www.tiagodemelo.info Bancos de dados distribuídos Prof. Tiago Eugenio de Melo tiagodemelo@gmail.com Última atualização: 20.03.2013 Conceitos Banco de dados distribuídos pode ser entendido como uma coleção de múltiplos bds

Leia mais

ALESSANDRO RODRIGO FRANCO FERNANDO MARTINS RAFAEL ALMEIDA DE OLIVEIRA

ALESSANDRO RODRIGO FRANCO FERNANDO MARTINS RAFAEL ALMEIDA DE OLIVEIRA ALESSANDRO RODRIGO FRANCO FERNANDO MARTINS RAFAEL ALMEIDA DE OLIVEIRA INTRODUÇÃO O projeto de um banco de dados é realizado sob um processo sistemático denominado metodologia de projeto. O processo do

Leia mais

04/08/2012 MODELAGEM DE DADOS. PROF. RAFAEL DIAS RIBEIRO, M.Sc. @ribeirord MODELAGEM DE DADOS. Aula 2. Prof. Rafael Dias Ribeiro. M.Sc.

04/08/2012 MODELAGEM DE DADOS. PROF. RAFAEL DIAS RIBEIRO, M.Sc. @ribeirord MODELAGEM DE DADOS. Aula 2. Prof. Rafael Dias Ribeiro. M.Sc. MODELAGEM DE DADOS PROF. RAFAEL DIAS RIBEIRO, M.Sc. @ribeirord MODELAGEM DE DADOS Aula 2 Prof. Rafael Dias Ribeiro. M.Sc. @ribeirord 1 Objetivos: Revisão sobre Banco de Dados e SGBDs Aprender as principais

Leia mais

Metodologias de Desenvolvimento de Sistemas. Analise de Sistemas I UNIPAC Rodrigo Videschi

Metodologias de Desenvolvimento de Sistemas. Analise de Sistemas I UNIPAC Rodrigo Videschi Metodologias de Desenvolvimento de Sistemas Analise de Sistemas I UNIPAC Rodrigo Videschi Histórico Uso de Metodologias Histórico Uso de Metodologias Era da Pré-Metodologia 1960-1970 Era da Metodologia

Leia mais

Gerenciamento de Projetos Modulo II Ciclo de Vida e Organização do Projeto

Gerenciamento de Projetos Modulo II Ciclo de Vida e Organização do Projeto Gerenciamento de Projetos Modulo II Ciclo de Vida e Organização do Projeto Prof. Walter Cunha falecomigo@waltercunha.com http://waltercunha.com PMBoK Organização do Projeto Os projetos e o gerenciamento

Leia mais

Técnicas de Caixa Preta de Teste de Software

Técnicas de Caixa Preta de Teste de Software Técnicas de Caixa Preta de Teste de Software Na maioria de projetos de teste, o tempo para a realização dos mesmos sempre é curto e os números de testes a serem realizados nas aplicações são inúmeros.

Leia mais

2 Diagrama de Caso de Uso

2 Diagrama de Caso de Uso Unified Modeling Language (UML) Universidade Federal do Maranhão UFMA Pós Graduação de Engenharia de Eletricidade Grupo de Computação Assunto: Diagrama de Caso de Uso (Use Case) Autoria:Aristófanes Corrêa

Leia mais

DESENVOLVIMENTO WEB DENTRO DOS PARADIGMAS DO HTML5 E CSS3

DESENVOLVIMENTO WEB DENTRO DOS PARADIGMAS DO HTML5 E CSS3 DESENVOLVIMENTO WEB DENTRO DOS PARADIGMAS DO HTML5 E CSS3 Eduardo Laguna Rubai, Tiago Piperno Bonetti Universidade Paranaense (Unipar) Paranavaí PR- Brasil eduardorubay@gmail.com, bonetti@unipar.br Resumo.

Leia mais

Arquitetura de Rede de Computadores

Arquitetura de Rede de Computadores TCP/IP Roteamento Arquitetura de Rede de Prof. Pedro Neto Aracaju Sergipe - 2011 Ementa da Disciplina 4. Roteamento i. Máscara de Rede ii. Sub-Redes iii. Números Binários e Máscara de Sub-Rede iv. O Roteador

Leia mais