Documento Descritivo do Mecanismo de Busca. Preparação do Portal para indexação



Documentos relacionados
1 Contextualização 3 2 Administração do Joomla 5 3 Painel de controlo Menu sítio Menu utilizadores Outras funcionalidades 8 4

Manual do Usuário - ProJuris Web - Biblioteca Jurídica Página 1 de 20

Como os Mecanismos de Busca da Web Indexam Páginas HTML

Projeto "Aqui Tem Cultura"

Modelos de Caso de Administração

O Sistema foi inteiramente desenvolvido em PHP+Javascript com banco de dados em MySQL.

SEO. Search Engine Optimization

REPÓRTER ADVFN - ARTIGOS

Universidade Federal do Espírito Santo

Relatório referente ao período de 24 de abril de 2007 a 29 de maio de 2007.

O uso correto do texto alternativo

Metadados. 1. Introdução. 2. O que são Metadados? 3. O Valor dos Metadados

MAIS CLIENTES, MAIS VENDAS SEO. Estampe sua marca na primeira página do Google

Você tem um sonho...

3 Estratégia para o enriquecimento de informações

Manual de Publicação Wordpress

COORDENAÇÃO DE EAD MANUAL DE UTILIZAÇÃO DO MOODLE 2.6 PERFIL ALUNO. Versão 1.0

Normas da Assessoria de Comunicação

GUIA DE APLICAÇÃO EBT

UNIPAMPA Universidade Federal do Pampa. Núcleo de Tecnologia da Informação (NTI)

Acompanhamento e Execução de Projetos

Índice. 5. Editar as seções de um curso 6. Estruturar o curso 7. Publicar o curso 8. Resumo do Fluxo de criação de um curso no educommons

Posições de template do projeto portal padrão

RESOLUÇÃO SEPLAG no. 51 / 2009 Altera a Resolução SEPLAG no. 40, de 18 de

paradigma WBC Public - compra direta Guia do Fornecedor paradigma WBC Public v6.0 g1.0

COMO ADICIONAR BANNER ROTATIVO Portal Ebserh Site dos Hospitais Universitários

Aula 2: Listas e Links

MANUAL MOODLE - PROFESSORES

DIFICULDADES NA COMPILAÇÃO DE UM CORPUS DE LÍNGUA ESPANHOLA

Otimização SEO Para Quem Não Entende de SEO Igor Mateus Otimização de SEO do jeito simples. Igor Mateus Consultor em Marketing Digital

Curso sobre Google Analytics - Outubro/2013 (em português)

Instituto Siegen Manual do Professor

FUNDO NACIONAL DE DESENVOLVIMENTO DA EDUCAÇÃO COORDENAÇÃO-GERAL DO PROGRAMA NACIONAL DA ALIMENTAÇÃO ESCOLAR

SEO Search Engine Optimization

Avaliação do site nanitesmedia.com

Manual do Usuário Publicador

7 Mudanças Realizadas

NOTA FISCAL DE SERVIÇO ELETRÔNICA (NFS-e) Manual de Utilização Envio de arquivos RPS. Versão 2.1

CENTRO UNIVERSITÁRIO DE ENSINO SUPERIOR DO AMAZONAS - CIESA CENTRO DE PROCESSAMENTO DE DADOS CPD MANUAL DE UTILIZAÇÃO DO MOODLE 2.

Conectar diferentes pesquisas na internet por um menu

Banco de Dados Orientado a Objetos

Tutorial WEB Soluço es Click.

Bem-vindo ao tópico sobre administração de listas de preços.

Manual do Aluno para o Curso do SEER à Distância

GOOGLE FOTÓGRAFOS. Sites e sistemas para fotógrafos Por Evandro Rocha

SEO Search Engine Optimization

Notas sobre o curso Information Architecture /98

Manual do Fórum do Meio Ambiente. Propõe instruções para primeiro acesso e funcionalidades básicas do sistema.

Manual de Comunidades RIPALC

ROTEIRO DE IMPLANTAÇÃO

Ian Castro de Souza CSO da Salve! Digital

3 Qualidade de Software

Olá, Somos Ideatera - Studio Tecnológico

17/2009. Edital para o Desenvolvimento do Portal do Idec e do Banco de Informações sobre Participação do Consumidor na Regulação

RESPONSÁVEIS COM CONTAS JULGADAS IRREGULARES Publicação de Informações na internet

CADERNOS DE INFORMÁTICA Nº 1. Fundamentos de Informática I - Word Sumário

MAIS CONTROLE SOFTWARE Controle Financeiro / Fluxo de Caixa (MCS Versão ) Índice

Ajuda On-line - Sistema de Relacionamento com o Cliente. Versão 1.1

Monitor de Comercialização - Proponente MT

PREFEITURA MUNICIPAL DE BOM DESPACHO-MG PROCESSO SELETIVO SIMPLIFICADO - EDITAL 001/2009 CARGO: COORDENADOR DE INCLUSÃO DIGITAL CADERNO DE PROVAS

ALTERAÇÃO DAS CONFI GURAÇÕES PESSOAI S... 3 I NSERÇÃO DE M ATERI AL NO PORTAL NOTÍ CI A EVENTO PÁGI NA I MAGEM...

Manual do Usuário. Protocolo

INTERNET EXPLORER 8 EXPLORER EXPL 8 ORER 8

Índice. PROCEDIMENTO OPERACIONAL PADRÃO Código: POP Sistema: TOTVS RM Módulo: TREINAMENTO E DESENVOLVIMENTO Processo: CADASTRO LNTD

Q-Acadêmico. Módulo CIEE - Estágio. Revisão 01

A SEGUIR ALGUMAS DICAS PARA O DESENVOLVIMENTO DE UM PROJETO CIENTÍFICO

Inserção de Ponto de Entrada. Autoenge Módulo Automação Página 1

MANUAL DE UTILIZAÇÃO DOMINIO ATENDIMENTO

Manual de uso do SACI

CONVÊNIO TJ-SC 10/2014

Palavras-chave de um site: conceitos e ferramentas 11/7/2012. Ministrante: André

Manual do Aluno Moodle

3. Fase de Planejamento dos Ciclos de Construção do Software

Chamada de Propostas. Comitê Técnico de Videocolaboração CT-Vídeo

PIM TECNOLOGIA EM GERENCIAMENTO DE REDES DE COMPUTADORES (GR3P30)

CASA CIVIL DEPARTAMENTO DE TRÂNSITO DO PARANÁ DETRAN/PR SISTEMA DETRAN/PR APLICATIVO DE VISTORIA ELETRÔNICA DE VEÍCULOS MANUAL DO USUÁRIO

COMITÊ DE ÉTICA EM PESQUISA DA ESCOLA DE SAÚDE PÚBLICA DO CEARÁ

Manual do Operacional do Sistema Calendário da Gestão Municipal. 1ª Versão

Ao redigir este pequeno guia pretendi ser conciso, indo directamente ao essencial.

DotNetNuke. Gestão de Conteúdos. Módulos - II. Inserção de conteúdos nos módulos. Módulo de Text/HTML. Módulo de Sre-Notícias. Módulo de Sre-Formação

Módulo 9 A Avaliação de Desempenho faz parte do subsistema de aplicação de recursos humanos.

Manual das planilhas de Obras v2.5

Bem-vindo ao curso delta Gerenciamento de peso para a versão 9.1. Este curso aborda a nova solução de peso introduzida nessa versão.

Web Marketing. Introdução. Números dos sites de busca. A Web é o maior depósito de informações do mundo:

WEB E WEB APPLICATION CMS JOOMLA PROPOSTA WEBSITE. Índice. Página:1

agility made possible

Capítulo 13 Pastas e Arquivos

MAPEAMENTO DIGITAL DA REDE DE ARTICULAÇÃO INTERSETORIAL PARA PROMOÇÃO DA SAÚDE PARTE 2 MOOTIRO MAPS

BearingNet - Orçamentos Contenuto

UNIVERSIDADE FEDERAL DE GOIÁS PRÓ-REITORIA DE EXTENSÃO E CULTURA XI CONGRESSO DE PESQUISA, ENSINO E EXTENSÃO CONPEEX

Objetivo: descrever como abrir uma solicitação de suporte técnico através da internet.

Manual Portal PADRÃO. Gerenciador de Temas: Editar Estilo. 1. Clique na aba Extensões e em seguida em Gerenciador de Temas.-

BLOG ESCOLAS. Após acessar o seu respectivo blog, você será direcionado a tela a seguir. Vamos conhecê-la um pouco melhor.

Guia para utilização do ambiente de EaD UniRitter

Como fazer uma pesquisa de Imagens

Através do portal e nos sites das secretarias, demais órgãos e entidades da administração pública estadual baiana.

Transcrição:

Documento Descritivo do Mecanismo de Busca Este documento visa esclarecer as regras que serão executadas pelo mecanismo de busca para a recuperação de informações a partir de uma palavra e/ou expressão pesquisada no portal do Governo de Minas. Preparação do Portal para indexação A preparação de um site para os primeiros lugares dos resultados das buscas é conhecido em português pela expressão "otimização para buscadores" (em inglês, SEO, search engine optimization). Algumas medidas serão tomadas para ajudar a melhorar o ranking Portal do nos resultados de busca. Otimizar título do Portal, e das páginas do Portal, pois o título é um dos principais fatores de decisão para posicionamento do site em relação às palavras-chave usadas em uma busca. Otimizar as meta tags para o bom posicionamento do Portal nas buscas. Quando bem escrita, aproveitando-se corretamente das palavras-chave da página em questão, pode chamar a atenção do usuário e do buscador. Incluir nos conteúdos publicação de tags, termos-chave de acesso, palavras-chaves e expressões familiares aos usuários. É importante inserir as palavras-chave mais importantes no início dos textos, incluir títulos (title tags) relevantes e únicos em cada conteúdo e atualizá-los constantemente. Consultar nas estatísticas de acesso e na ferramenta de busca do próprio Portal, periodicamente, as palavras-chave mais utilizadas nos buscadores para acessar o site e inseri-las nos conteúdos de forma a facilitar a localização das mesmas pelo usuário. Construir o Portal segundo os padrões web, deixando os arquivos CSS e JavaScript fora da página, diminui o tamanho do código e favorece a indexação. A arquitetura da informação deve preocupar-se em colocar os itens mais importantes da estrutura nos níveis superficiais, preferencialmente nos 2 primeiros níveis, para que os mecanismos de busca encontrem mais facilmente as páginas mais importantes e seu conteúdo. Quando há necessidade de aprofundar os níveis, as camadas intermediárias devem conter as principais palavraschave dos níveis mais profundos. 1

Aplicar nomenclatura consistente nas páginas e nos arquivos (imagens, PDFs, vídeos) e conteúdos. Exemplos: Não Recomendável Tesepmsouza.pdf icone5.jpg Recomendável microbiologiaaplicada_paulomatosdesouza.pdf literatura_novidades.jpg. Nos exemplos acima, os nomes dos arquivos da primeira coluna não apresentam informações consistentes sobre seu conteúdo, enquanto os nomes da segunda coluna contêm palavras que serão efetivamente pesquisadas. Preparar a URL da página com palavras relacionadas ao conteúdo, mas evitar URLs muito longas, que dificultam a digitação e o arquivamento pelos usuários e não são bem aceitas pelos buscadores. Promover a publicação da URL em sites de parceiros, contatos, clientes, assinantes, comunidades, redes sociais, blogs. Estes links devem ser direcionados para o próprio conteúdo, em vez de encaminhar para a página principal. Inserir meta informações sobre o conteúdo, como "robots", "keywords" e "description" e aplicar marcações para as páginas que não devem ser indexadas, como <META NAME="robots" content="noindex, nofollow">. Acompanhar as atualizações dos métodos e algoritmos dos buscadores, que mudam sempre (assim como a posição dos links no ranking de cada uma). Evitar listas de links fora de contexto e marcações enganosas para forçar um ranking privilegiado nos resultados. Publicar um mapa do site facilmente indexável (em modo texto) com os títulos e URLs da maioria das páginas ou das principais áreas de conteúdo. Preparar os arquivos de vídeo e áudio com legendas e textos alternativos ("alt tags"), com descrições do conteúdo e informações de autoria e direitos de publicação Evitar a utilização de arquivos em Flash, mas se utilizar, prepará-los com legendas e textos alternativos, pois muitos destes arquivos ainda são reconhecidos como imagem e os links são indexados de maneira muito simplificada. Aplicar normas de usabilidade e acessibilidade na formatação do conteúdo para facilitar a sua indexação. Utilizar a ferramenta do yahoo.com para identificar sites que fazem hiperlink para o antigo portal mg.gov.br Linkdomain:mg.gov.br. A lista de links já identificados no Anexo I deste documento, já está sendo avaliada para mapeamento das novas URLs, a fim de evitar queda do atual pagerank do Portal. 2

Regras de composição de resultados de busca A busca pelo(s) termo(s) pesquisado(s) é realizada em conteúdos indexados no banco de dados do Portal, conforme padrões citados no item acima. A pesquisa pode ser realizada por um ou vários termos/palavras ou por frases e expressões e os resultados apresentados contêm o(s) termo(s) pesquisado(s), uma ou mais vezes, em seu conteúdo. Também é possível restringir a busca quando se possui mais informações sobre o item procurado, utilizando os filtros 1 para argumentos de pesquisa, o que oferece resultados mais objetivos para o usuário. Campos/Botões Descrição Retornar Retorna à pagina anterior que foi navegada pelo usuário. Busca Avançada Esconde/exibe os campos de filtro da pesquisa. Alterna a exibição dos resultados encontrados entre imagens e conteúdos do Portal / Imagens Portal. Campo para se informar palavras que possam estar relacionadas ao conteúdo Buscar nas tags selecionadas desejado na pesquisa. Adicionar tag Incluir palavra informada nos argumentos de pesquisa. Remover todas Remover todas as palavras incluídas nos argumentos de pesquisa. Filtrar por Campo para filtrar nome das comunidades (área do Portal) exibidas. Adicionar todas as comunidades (áreas do Portal) listadas nos argumentos de Adicionar todas pesquisa. Remover todas Remover todas as comunidades informadas como argumento de pesquisa. + Adiciona comunidade selecionada aos argumentos de pesquisa. - Remove comunidade selecionada dos argumentos de pesquisa. Filtro para informar a precisão dos resultados. Os valores possíveis são: - Alguma das palavras: pesquisa nos itens indexados conteúdos que contenham quaisquer termos informados. Considerar - Todas as palavras: pesquisa nos itens indexados conteúdos que contenham todos os termos informados. - Frase exata: pesquisa nos itens indexados conteúdos que contenham exatamente a frase informada. 1 Será incluído filtro que dará ao usuário a opção de pesquisar, também, por termos relacionados ou sinônimos. 3

Buscar por Filtro por tipo de item a ser pesquisado. - Arquivo - Conteúdo - FAQ - Fórum Os valores possíveis são: - Imagem - Notícia - Serviço Ordenar por Resultados p/ página Aproximação Busca Ok Critério de apresentação dos resultados. Os valores possíveis são: - Relevância: considera em que parte e quantas vezes o termo aparece no conteúdo. Termos contidos no título têm maior relevância, termos contidos na descrição têm média relevância e termos contidos no corpo têm menor relevância. - Mais recentes: ordena os resultados pela data da última alteração do conteúdo, apresentando os conteúdos de data mais recente primeiramente. - Título: ordena os resultados alfabeticamente pelo título do conteúdo. - Descrição: ordena os resultados alfabeticamente pela descrição do conteúdo. Quantidade de resultados apresentados por página. Os valores possíveis são: - 10-20 - 40-60 - 80-100 Critério de similaridade com a grafia do(s) termo(s) informado(s). Os valores possíveis são: - Igual - Média - Alta - Baixa Campo para digitação do(s) termo(s) desejado(s). Botão que aciona a pesquisa do termo(s) informado(s). Regras de definição de ranking e posicionamento dos resultados O mecanismo baseia-se no Modelo de Espaço Vetorial (VSM Vectorial Space Model), no qual o peso dado a um determinado termo-índice é uma variável real que reflete o grau de relevância do termo dentro do documento. Neste modelo, tanto o documento quanto a pesquisa são considerados vetores sobre o espaço de termos. A função de similaridade - sim(d,q) - entre uma pesquisa e um documento é definida como o ângulo entre a representação vetorial do documento e a representação vetorial da consulta, de forma que, quanto menor o ângulo entre os dois vetores, maior é a relevância do documento em relação à pesquisa. Este valor calculado é chamado score e é a forma padrão de cálculo de relevância para exibição de resultados. Entretanto, é permitida a parametrização desta relevância, informando um valor entre 1 e 5 (boost) para tipos e campos de conteúdo, sendo o valor 5 mais relevante. A Powerlogic fará a parametrização necessária, de acordo com as diretrizes que serão fornecidas pela SEPLAG. Fórmula para o cálculo do score: Onde: 4

tf(t in d) - corresponde à frequência do termo, que é definida pelo número de vezes em que t aparece no documento d (documento em que o score está sendo calculado). Documentos que possuem mais ocorrências de um determinado termo têm score mais alto. idf(t) sigla para Frequência Inversa em Documentos (Inverse Document Frequency). Este valor corresponde ao inverso do docfreq (o número de documentos nos quais cada termo t aparece). Isto significa que termos mais raros dão maior contribuição para o valor total do score. coord(q,d) é um fator para o cálculo do score, baseado em quantos termos da consulta são encontrados no documento especificado. Normalmente, um documento que contém mais termos da consulta receberá um valor de score maior que outro com menos termos. querynorm(q) é um fator de normalização usado para definir scores entre consulta similares. Este fator não afeta a avaliação do documento, uma vez que todos os documentos avaliados são multiplicados pelo mesmo fator. A intenção deste fator é apenas tentar obter valores de consultas ou indexes similares. t.getboost() é um impulso (boost) para o tempo de busca do termo t em uma consulta q, conforme especificado no texto da consulta, ou em uma chamada setboost() definida na aplicação. norm(t,d) condensa alguns fatores de impulsos (boosts) e duração (tempo de indexação): o o o Impulso em documento determinado implementando a chamada doc.setboost() antes de adicionar o documento no índex. Impulso em campo - determinado implementando a chamada field.setboost() antes de incluir o campo em um documento. lengthnorm(field) calculado quando o documento adicionado ao índex, de acordo com o número de tokens do campo no documento, de modo que campos menores contribuam mais para o score. Quando um documento é adicionado ao índex, todos os fatores acima são multiplicados. Se um documento possui vários campos com o mesmo nome, todos os seus impulsos (boosts) são multiplicados juntos. Regras de associação de resultados a partir do vocabulário controlado O vocabulário controlado, uma vez identificado e cadastrado no banco de dados do Portal, será indexado juntamente com os conteúdos definidos. Ao usuário final será permitida a escolha de realizar a busca utilizando ternos relacionados ou sinônimos do termo informado, quando realizar a pesquisa pela busca avançada. A busca simples e principal, que ficará disponível em todas as páginas do Portal, no canto superior direito, terá por padrão pesquisar os termos relacionados ao termo informado. Esta regra permitirá que o usuário final, mesmo não conhecendo o termo oficial, encontre o conteúdo desejado, informando a forma coloquial de expressão do termo. Como exemplo, podemos citar siglas de órgãos, entidades e documentos. Além disso, a diversidade de resultados pode apresentar conteúdos que sejam relevantes para o usuário naquele momento, mas que o mesmo não havia previsto pesquisar. A utilização do vocabulário controlado na pesquisa permitirá a antecipação dos desejos e necessidades do usuário final, facilitando sua utilização do Portal e tornando sua visita mais agradável e memorável. 5

Bibliografia ecompany Administration Guide ecompany Portal versão 5.1 [ROSENFELD, L.; MORVILLE, P.] Information Architecture for the World Wide Web. 3. ed. Sebastopol, CA: O'Reilly, 2006. http://lucene.apache.org/java/2_4_0/api/org/apache/lucene/search/similarity.html consultado em 27/10/2009 [SMITH, GENE] Tagging - People Powered Metadata for Social Web, 1.ed. Berkeley, CA: Gene Smith, 2008. http://www.mestreseo.com.br/tutorial-seo consultado em 26/10/2009 http://www.seomoz.org/dp/seo-industry-survey-results consultado em 26/10/2009 6