Programação para Internet I. 10. Motores de busca. Nuno Miguel Gil Fonseca nuno.fonseca@estgoh.ipc.pt



Documentos relacionados
Como Criar Sites Grátis de Sucesso

Criação de Páginas Web - MS Word 2000

2.1. PHP - Introdução

Análise da Informação Económica e Empresarial

SEO Search Engine Optimization

5. Métodos ágeis de desenvolvimento de software

Apresentação. Sistema de E-Commerce

Programação para Internet I. 1. Servidores web. Nuno Miguel Gil Fonseca

Operador de informática. ... quando nos ligamos a internet, o mais certo é que parte substancial do tempo seja gasto à procura de informação.

A World Wide Web é um repositório gigantesco de informação gratuita em permanente crescimento e actualização

Índice. 3 Capítulo 1: Visão Geral do Blog. 4 Capítulo 2: SEO. 5 Capítulo 3: Backend: Como Funciona. Visão Geral Plataforma Frontend Backend

Marke&ng de Busca SEO

É uma rede mundial de computadores ligados entre si. INTERNET

Web Design. Prof. Felippe

A SÈTIMA. O nosso principal objectivo

Construção Páginas de Internet

2.9. PHP Cookies e variáveis de sessão

VOCÊ SABE O QUE É UM GUEST POST? by Eliel Nogueira

ROTEIRO DE IMPLANTAÇÃO

Guia rápido para buscas de literatura científica na Internet. Raphael Augusto Teixeira de Aguiar

Ao redigir este pequeno guia pretendi ser conciso, indo directamente ao essencial.

1. INTERNET OU NET. Hardware. Computador. Linha telefónica normal, linha RDIS, ligação por cabo ou ADSL. Modem

INTERNET E PROGRAMAÇÃO WEB

Editor HTML. Composer

9. Quais as características a tecnologia de conexão à Internet denominada ADSL A) Conexão permanente, custo variável, linha telefônica liberada e

Oficina de Construção de Páginas Web

O que é um Afiliado EaDPLUS? Por que ser Afiliado EaDPLUS? Quais cursos o Afiliado EaDPLUS pode divulgar?

Guia de Estudo Folha de Cálculo Microsoft Excel

Programação para Internet I. 2. O protocolo HTTP. Nuno Miguel Gil Fonseca nuno.fonseca@estgoh.ipc.pt

Internet ou Net. É uma rede mundial de computadores ligados entre si através s de linhas telefónicas comuns.

GereComSaber. Desenvolvimento de Sistemas de Software. Universidade do Minho Conselho de Cursos de Engenharia Licenciatura em Engenharia Informática

Base de Dados para Administrações de Condomínios

Introdução. matematica-divertida.com. World Wide Web (WWW) Evolução da Internet. Cada vez mais fácil! Escrevendo páginas 25/10/2011

Agrupamento Vertical de Escolas de Salir Biblioteca Escolar 2008/2009. Como fazer um trabalho

PESQUISA DE INFORMAÇÕES TÉCNICAS E CIENTÍFICAS NA INTERNET. OLIVEIRA, Simone Lucas Gonçalves de

PARANÁ GOVERNO DO ESTADO

A Universidade do Porto

internet internet... abrir o programa... pag.. 6 ecrã do internet explorer... ligações... escrever um endereço de internet...

2.3. PHP Tipos de dados e operadores

GOOGLE FOTÓGRAFOS. Sites e sistemas para fotógrafos Por Evandro Rocha

GUIA PARA COMPRA ONLINE

Guia de Consulta. Percorrer

MÓDULO MULTIMÉDIA PROFESSOR: RICARDO RODRIGUES. MAIL: URL:

CONSTRUÇÃO DE BLOG COM O BLOGGER

WEBSEMANTICA PROF.DANIELA PIRES

Conferência ego Real Estate SEO. Search Engine Optimization. Otimização para Motores de Pesquisa. Portal Nacional de Imobiliário #1

Dia Regional da Segurança na

Sistemas e Conteúdos Multimédia. 4.2.Animação. Nuno Miguel Gil Fonseca nuno.fonseca@estgoh.ipc.pt

UNIVERSIDADE FEDERAL DE PELOTAS. Índice

TECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO. SISTEMAS DE GESTÃO DE BASE DE DADOS Microsoft Access TECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO

MÓDULO MULTIMÉDIA. Text PROFESSOR: RICARDO RODRIGUES. MAIL: URL:

DEPARTAMENTO DE MATEMÁTICA E CIÊNCIAS EXPERIMENTAIS

Bases de Dados. Lab 1: Introdução ao ambiente

Formação presencial em contexto de sala de aula, com recurso à utilização prática do software WordPress.

1. Quem somos nós? A AGI Soluções nasceu em Belo Horizonte (BH), com a simples missão de entregar serviços de TI de forma rápida e com alta qualidade.

Curso de Instalação e Gestão de Redes Informáticas

World Wide Web. Disciplina de Informática PEUS, U.Porto. Disciplina de Informática, PEUS 2006 Universidade do Porto

VISUAL LIGHTBOX FERRAMENTA WEB DESIGN FABIANO KEIJI TAGUCHI

Internet Visão Geral. O que é a Internet? Ong Ação Cidadã

Atualizações Automáticas GUIA DE PROCEDIMENTOS E CONFIGURAÇÕES

Conceito. As empresas como ecossistemas de relações dinâmicas

Você tem um sonho...

Oficina de Construção de Páginas Web

Microsoft Office FrontPage 2003

PARANÁ GOVERNO DO ESTADO

Banco de Imagens. Grupo Auto Sueco. Banco de Imagens Grupo Auto Sueco 1 (10) Filipe Emanuel Moreira José Albuquerque 1.

Curso Superior de Tecnologia em Análise e Desenvolvimento de Sistemas Prof. Felippe Scheidt IFPR Campus Foz do Iguaçu 2014/2

Centro Digital Aula 1

Hashing Letícia Rodrigues Bueno

SEO Juliano Torriani Lehugeur

CONFLITO DE SER MÃE EMPREENDEDORA

COMO CRIAR UMA LOJA VIRTUAL?

O Googlebot não consegue aceder a ficheiros CSS e JS em seu blog

4.3 Ferramentas para criar conteúdos/recursos educativos

Web Marketing. Introdução. Números dos sites de busca. A Web é o maior depósito de informações do mundo:


Organizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU

Técnicas de pesquisa avançada na Internet

Análise de Integridade dos Sites da Administração Pública

Bibliotecária = mecanismo de busca..

Curso Completo de Marketing Multinível MARKETING DE ATRAÇÃO

GANHAR DINHEIRO COM SEU SITE OU BLOG

Pesquisas Google - O Essencial

Tutorial: criação de uma Ficha de Voluntário online

[Documentação da Plataforma MY.IPLEIRIA.PT dos Estudantes do IPLeiria]

Agentes Inteligentes segundo o Chimera

Guia da Internet. Página 1

Manual de Administração Intranet BNI

Proposta. Atribuição de endereços IPv6 na UTL

INTRODUÇÃO. Esse relatório tem como objetivo mostrar a situação atual da otimização do site SISPONTO

TIC TECNOLOGIAS DA INFORMAÇÃO (TI) TECNOLOGIAS ORIGEM DA PALAVRA

Auxiliar de pesquisa

COMPETÊNCIAS BÁSICAS EM TIC NAS EB1. Oficina da Internet. Actividades de exploração

memmolde Norte: uma contribuição para a salvaguarda da memória colectiva da indústria de moldes do Norte de Portugal

Akropole Catequista. Todos os Ficheiros no Akropole Catequista trabalham com uma simples barra de edição, com 4 botões:

Banco de Dados Modelo Conceitual, Lógico, Físico, Entidade- Relacionamento (ER) Hélder Nunes

We Send.You Sell. Solução de envio de newsletters. (A You Sell Iniciative)

Transcrição:

Programação para Internet I 10. Motores de busca Nuno Miguel Gil Fonseca nuno.fonseca@estgoh.ipc.pt

A Internet assume-se como a maior fonte de informação de todos os tempos No entanto, a informação encontra-se muito dispersa... Para nos ajudar a encontrar a informação pretendida podemos recorrer a motores de busca (search engines) Um search engine mais não é do que uma página web especial! (c) Nuno Miguel Gil Fonseca - Escola Superior de Tecnologia e Gestão de Oliveira do Hospital - Programação para Internet I 2

Existem diversos search engines, no entanto, todos têm características comuns: Permitem procurar na World Wide Web (partes dela) com base em palavras chave Têm um índice de palavras chave, assim como o local onde podem ser encontradas essas palavras (os sites) Os motores de busca de hoje em dia criam os índices automaticamente, antigamente, o que existiam eram serviços de apontadores! (c) Nuno Miguel Gil Fonseca - Escola Superior de Tecnologia e Gestão de Oliveira do Hospital - Programação para Internet I 3

Construção dos índices Para que se possam efectuar pesquisas, é necessário que a informação esteja indexada. Hoje em dia os índices são construídos graças a software especial : spiders Ao processo de construção dos índices dá-se o nome de web crawling. Para se conseguir ter um índice que permita obter bons resultados nas pesquisas, é necessário analisar muitas páginas web Actualmente o google indexa 8,058,044,651 web sites. (c) Nuno Miguel Gil Fonseca - Escola Superior de Tecnologia e Gestão de Oliveira do Hospital - Programação para Internet I 4

Construção dos índices (cont.) Qual o ponto de partida das indexações? Usualmente o ponto de partida são servidores com elevada carga, ou web sites com grande número de visitantes Começa-se por indexar a página principal de determinado site e em seguida, são seguidos todos os links aí existentes e analisadas as páginas a que eles conduzem. O processo repete-se vezes sem conta... (c) Nuno Miguel Gil Fonseca - Escola Superior de Tecnologia e Gestão de Oliveira do Hospital - Programação para Internet I 5

Construção dos índices (cont.) Os índices são geralmente guardados na forma de hash table Um conjunto de informação encontra-se associada a uma determinada chave de hash (uma palavra) que irá determinar de forma muito rápida onde se encontra a informação que pretendemos encontrar Esse conjunto de informação envolve normalmente: O URL da página onde a palavra ocorre O número de vezes que a palavra ocorre nessa página etc. Associados aos objectos ligados às palavras encontram-se pesos, cujo valor é calculado com base no local onde as palavras ocorrem, o número de vezes que ocorrem (c) Nuno Miguel Gil Fonseca - Escola Superior de Tecnologia e Gestão de Oliveira do Hospital - Programação para Internet I 6

Construção dos índices (cont.) (c) Nuno Miguel Gil Fonseca - Escola Superior de Tecnologia e Gestão de Oliveira do Hospital - Programação para Internet I 7

Meta-tags Permitem que os donos das páginas especifiquem determinadas palavras chave e conceitos sobre as quais as páginas serão indexadas pelos motores de pesquisa. São muito úteis em situações em que as palavras contidas no conteúdo das páginas possam ter mais do que um sentido. Ex.: Banco, peça de mobiliário e banco entidade bancária. <head> <Meta Name="Description" Content= O melhor site do mundo sobre carros"> <Meta Name="keywords" Content= carros, corridas, automóveis, válvulas, cavalos, potência, cilindrada"> </head> (c) Nuno Miguel Gil Fonseca - Escola Superior de Tecnologia e Gestão de Oliveira do Hospital - Programação para Internet I 8

Caso de estudo: Google Começou como um projecto académico O sistema inicial já permitia usar múltiplos spiders em simultâneo (3) Cada spider conseguia ter até 300 ligações para páginas web abertas em simultâneo Este sistema conseguia indexar cerca de 300 páginas por segundo, produzindo cerca de 600 kb de informação (c) Nuno Miguel Gil Fonseca - Escola Superior de Tecnologia e Gestão de Oliveira do Hospital - Programação para Internet I 9

Caso de estudo: Google (cont.) Quando o google abre uma página para indexar, olha para: As palavras contidas na página O local onde essas palavras ocorrem O google está preparado para excluir das indexações artigos ( the, an, a, etc.), principalmente por razões de velocidade de indexação e posterior pesquisa Por vezes recorre-se a meta-tags para apoiar a indexação (c) Nuno Miguel Gil Fonseca - Escola Superior de Tecnologia e Gestão de Oliveira do Hospital - Programação para Internet I 10

As pesquisas Nas pesquisas podem geralmente usar-se operadores booleanos (AND, OR, NOT) Podem usar-se aspas para tornar as pesquisas mais especificas O google permite fazer mais mil e uma coisas (existe um livro na biblioteca dedicado exclusivamente a este motor de busca) (c) Nuno Miguel Gil Fonseca - Escola Superior de Tecnologia e Gestão de Oliveira do Hospital - Programação para Internet I 11

O que fazer para aparecer nos primeiros lugares (aumentar o page rank) Acima de tudo escrever conteúdos de qualidade que interessem ao maior número de pessoas Fazer ligações do nosso site para outros sites importantes (esperar que os outros façam o mesmo!) Divulgar o nosso site em blogs, foruns, etc. (colocando o endereço na assinatura, por exemplo) cuidado com o SPAM! Dar nomes elucidativos aos ficheiros Dar títulos elucidativos às páginas Fazer uso das meta-tags (keywords, discription, etc ). (c) Nuno Miguel Gil Fonseca - Escola Superior de Tecnologia e Gestão de Oliveira do Hospital - Programação para Internet I 12

O que fazer para aparecer nos primeiros lugares (aumentar o page rank) Efectivamente não é muito fácil aumentar de um dia para o outro o pagerank de uma página, mas há de facto uma série de factores que podem ser tidos em conta http://www.vaughns-1-pagers.com/internet/google-rankingfactors.htm http://www.google.com/support/webmasters/bin/answer.py?hl =en&answer=35769 (c) Nuno Miguel Gil Fonseca - Escola Superior de Tecnologia e Gestão de Oliveira do Hospital - Programação para Internet I 13

O futuro Pesquisas de conceitos Pesquisas por pedaços de imagens, trechos de música, video, etc. Pesquisas em função do contexto (local, data/hora, actividade, identidade, ) (c) Nuno Miguel Gil Fonseca - Escola Superior de Tecnologia e Gestão de Oliveira do Hospital - Programação para Internet I 14

Alguns motores de busca http://www.google.com http://www.altavista.com http://www.go.com http://search.com http://www.hotbot.com http://www.lycos.com http://www.tumba.pt http://www.sapo.pt http://www.bing.com/ (c) Nuno Miguel Gil Fonseca - Escola Superior de Tecnologia e Gestão de Oliveira do Hospital - Programação para Internet I 15

Mais informações http://www.searchengineshowdown.com http://searchenginewatch.com (c) Nuno Miguel Gil Fonseca - Escola Superior de Tecnologia e Gestão de Oliveira do Hospital - Programação para Internet I 16