ARQUITECTURA DE UM MOTOR DE BUSCA: EXEMPLO DO GOOGLE
|
|
- Marco Antônio de Sá Chaplin
- 8 Há anos
- Visualizações:
Transcrição
1 ARQUITECTURA DE UM MOTOR DE BUSCA: EXEMPLO DO GOOGLE por Vasco Nuno Sousa Simões Pereira Sumário. Este artigo explica em modos gerais a arquitectura de um dos motores de busca mais populares actualmente, o Google. Pretende-se mostrar como uma aplicação que lida com um volume de dados gigantesco pode beneficiar de uma abordagem que envolve computação paralela e de bases de dados distribuídas. No fim são feitas algumas considerações sobre aplicações desta arquitectura a outros cenários. Palavras chave. Internet, bases de dados distribuídas, computação paralela, motores de busca 1. Introdução No início a Internet era um meio de comunicação acedido por apenas uma comunidade restrita. Com o aparecimento da WWW (World Wide Web) com base no protocolo HTTP (Hyper Text Transfer Protocol), essa comunidade teve um crescimento exponencial, permitindo o acesso generalizado de uma vasta faixa de população. Os novos utilizadores não só passaram a poder aceder a um conjunto de informação de uma maneira rápida como puderam também participar no aumento dessa mesma informação criando sites acerca dos mais variados temas e conteúdos. Isto gerou uma dinâmica nunca antes vista com milhares de novos sites a aparecerem num curto espaço de tempo. Começou então a surgir a questão de como catalogar esses sites, como fazer para que fossem do conhecimento do resto da comunidade. As abordagens tradicionais, como a lista telefónica, tiveram um êxito limitado pois a dinâmica da Internet não se compadecia com um meio de divulgação tão estático. Na data de saída de cada lista já esta estava completamente desactualizada, com uma grande parte dos sites a ficar irremediavelmente de fora. Era então necessária outra forma de catalogar a Internet. Essa solução foi encontrada com motores de busca, aplicações que permitiam pesquisas pela Internet com base em uma ou mais palavras-chave. Neste pequeno artigo vai-se apresentar a arquitectura de um dos mais populares motores de busca do momento, o Google. O artigo não pretende ser exaustivo nem demasiado profundo, apenas dar a conhecer uma aplicação prática, de grande relevância, do uso massivo de computação paralela e de bases de dados distribuídas. Este trabalho insere-se no mestrado em Informática e Sistemas do Departamento de Engenharia Informática da Universidade de Coimbra, e foca dois dos temas abordados na disciplina de Seminário 1, computação paralela e bases de dados distribuídas. 2. Solução Google Criado por dois investigadores da Universidade de Stanford em 1998, o Google é um dos mais populares motores de busca da Internet, existindo em várias línguas e distribuído por vários continentes. Nas suas bases de dados constam cerca de 6 biliões de itens, maioritariamente páginas web [1], os quais têm actualmente cerca de 200 milhões de acessos por dia. De modo a suportar esta performance foi criado um cluster de cerca de servidores Linux de baixo custo que, num tempo médio próximo do meio segundo, devolve os resultados pretendidos pelo utilizador. Na génese da arquitectura do Google um factor foi essencial: a relação preço/performance [2]. 2.1 Enquadramento do problema Os motores de busca para a Internet são programas que, dadas determinadas palavras-chave ou expressões, por um qualquer utilizador, devolvem uma lista de hiper-ligações para documentos onde essas palavras existem. De modo a poderem realizar essa tarefa os motores de busca têm armazenadas na sua base de dados um vasto conjunto de informação extraída da Internet, que previamente indexaram e catalogaram. Para criar essas bases de dados existem programas auxiliares (webcrawlers ou spiders) que percorrem constantemente a Internet à procura de sites novos, os quais são posteriormente tratados e adicionados às bases de dados. Cada motor de busca usa um algoritmo específico de indexação das palavras existentes nos documentos encontrados, de modo a poder depois devolver resultados por ordem de relevância. Cada pedido a um motor de busca gera uma sequência de operações que necessita de uma grande capacidade de computação, bem como de um grande número de acessos a disco. É necessário pesquisar Terabytes de informação constantes das bases de dados, agregar e ordenar resultados e, por fim, devolver os dados
2 obtidos ao utilizador. Além disso, tem de se ter em conta que o número de pedidos de pesquisas, por segundo, está na ordem dos milhares. Para que o sistema tenha um tempo de resposta aceitável é então necessário uma grande velocidade de processamento e de acesso a disco. Uma das formas de tornar real este cenário era recorrer a alguns dos mais rápidos super-computadores do mundo. O uso de supercomputadores tem no entanto vários problemas. O primeiro é o custo. Além de um elevado custo inicial há ainda o custo de se usar um sistema proprietário, onde qualquer alteração ou operação de manutenção implica ainda mais elevados custos. Outro factor importante é a escalabilidade. Com o aumento previsível do número de páginas nos próximos anos, bem como a indexação de outro tipo de conteúdos (ex. imagens), existirá uma inevitável diminuição da performance do sistema, requerendo alterações que se traduzirão num novo aumento exponencial de custos. Outro problema ainda é a fiabilidade desse sistema quando o que se pretende é um serviço contínuo sem falhas nem períodos de manutenção perceptíveis Arquitectura do Google O que a Google descobriu foi que as operações realizadas por um motor de busca eram altamente paralelizáveis, i.e., várias operações poderiam ser realizadas em paralelo devido ao facto de não dependerem umas das outras [2]. Esse foi o factor chave para a solução que viriam a adoptar. Essa solução passou pela criação de um cluster (conjunto de máquinas que trabalham com um mesmo objectivo, portando-se como uma única) de máquinas vulgares que, aproveitando a possibilidade de processamento paralelo, tinham a performance de um super-computador por uma fracção do custo. Esta arquitectura trazia ainda mais uma vantagem essencial, tornava o processo escalável. Em seguida será apresentada a arquitectura geral e alguns componentes de um cluster Google. Pesquisa. O objectivo do Google é responder às pesquisas dos vários utilizadores. Um esquema simplificado de todo o processo de pesquisa e devolução de resultados é apresentado na Figura 1. O inicio de qualquer pesquisa no Google começa pela introdução de palavras-chave, ou expressões, por um utilizador, usando um vulgar browser. Após o utilizador introduzir os termos a pesquisar, o primeiro passo é saber a qual dos clusters distribuídos por vários locais do mundo é que o utilizador se vai ligar. Essa selecção é feita por um balanceador de carga a nível do DNS (Domain Name Server), o qual devolve o endereço do cluster mais próximo do utilizador. Deste modo, é proporcionado um menor trajecto dos dados entre o utilizador e os servidores Google, ao mesmo tempo que se distribui a carga por vários locais do mundo. Em seguida, depois de escolhido o cluster, o pedido é redireccionado para um servidor web da Google (Google Web Server - GWS). Esta operação também é feita por um balanceador de carga que distribui equitativamente os pedidos pelos vários servidores. Estes GWS vão ser responsáveis por gerir a execução da pesquisa do utilizador e por formatar no fim os resultados em HTML (Hyper Text Markup Language). Verificador de sintaxe Pesquisa do utilizador Escolha do cluster no DNS Cluster A Cluster B GWS 1 Servidor de Indíces 1 Servidor de Indíces 2 GWS 2 Servidor de Índices 1 Servidor de docs 1 Servidor de docs 2 Sub-Índice 1 Sub-Índice 2 PC 1 PC 2 PC 1 Agregar resultados e calcular relevância dos documentos Lista de Documentos por ordem Servidor de publicidade Figura 1 Esquema simplificado da arquitectura do Google Quando a expressão de pesquisa chega ao GWS, e depois de verificada a sua sintaxe, vai começar a pesquisa às bases de dados. O primeiro acesso é feito pelos servidores de índices. Estes servidores acedem aos índices com base nas palavras-chave pedidas e retornam identificadores das páginas onde os termos foram encontrados. Devido ao seu grande tamanho, o índice é subdividido em várias partes, cada uma tendo um conjunto específico de máquinas associadas. Cada máquina destas replica as outras permitindo assim várias pesquisas simultâneas a essa parte do índice geral. Para que o trabalho seja dividido equitativamente, também aqui é usado um balanceador de carga. Os resultados finais da pesquisa
3 são então agregados e intersectados de modo a obter uma lista ordenada por relevância. O critério usado para calcular a relevância de uma página é proprietário da Google e é designado por PageRank [3]. Após saber quais os identificadores dos documentos, um processo análogo à pesquisa nos índices é realizado sobre os servidores de documentos. Pretende-se agora obter o título dos documentos, o seu URL e a parte do texto onde a palavra-chave é referida. Para que isto seja possível os servidores de documentos armazenam várias cópias da web! Em paralelo, é também feita uma pesquisa a um servidor de publicidade que determina se existe algum anúncio relevante tendo como base as palavras-chave inseridas pelo utilizador. Por fim a página é devolvida ao utilizador, depois de formatada em HTML. População das bases de dados. Devido à grande dinâmica da Internet as bases de dados têm de ser actualizadas com bastante regularidade, o que implica uma constante pesquisa de páginas na Internet. Isso é feito por vários spiders que, a partir de um URL (Uniform Resource Locator) inicial percorrem as várias páginas disponíveis. Essas páginas são depois indexadas por um programa indexador que faz o parsing do documento convertendo-o numa lista de palavras. De tempos a tempos as bases de dados de índices presentes nos vários milhares de máquinas, são actualizadas [4]. Paralelismo. Devido ao facto da maioria das operações poder ser realizada em paralelo, é possível ter pesquisas diferentes a usar diferentes processadores e ter uma mesma pesquisa dividida por vários processadores. Pode-se por exemplo dividir uma pesquisa nos seu vários termos (palavras-chave) e usar máquinas diferentes para pesquisar resultados. No final, após encontrados os resultados parcelares, é apenas necessária uma operação de agregação dos resultados que, comparativamente, é bastante mais rápida. Ao mesmo tempo, não há problemas relevantes de coerência de dados visto que a grande maioria de operações são apenas de leitura. Escalabilidade. A solução apresentada pela Google apresenta-se bastante escalável. Conforme os índices e o número de documentos vão crescendo apenas é necessário juntar à estrutura mais um conjunto de PCs que pesquisem o novo pedaço do índice ou o novo conjunto de documentos. Ao mesmo tempo, se o problema for o tempo médio de resposta, basta acrescentar máquinas a cada grupo para que cada uma trate de menos pedidos de cada vez. Fiabilidade. Uma das grandes vantagens desta arquitectura é a sua inerente tolerância a falhas, que é assegurada por software. Não são feitos investimentos em hardware redundante como várias fontes de alimentação ou soluções RAID (Redundant Array of Inexpensive Disks), mas assegura-se por software que caso uma das máquinas tenha algum problema, outra tome o seu lugar. Embora esta solução possa implicar uma perda de performance temporária, manterá sempre o sistema completamente funcional. Deste modo, aproveita-se a replicação natural inerente à arquitectura usada, diminuindo ao mesmo tempo os custos. Como resultado final, consegue-se obter uma estrutura fiável a partir de máquinas individualmente não fiáveis. Hardware. Na Google grande parte dos computadores usados são vulgares PCs, correndo Linux, apenas se distinguindo por terem bastante capacidade de disco. As máquinas usadas não são escolhidas em termos de performance máxima mas sim pela relação performance/custo. A arquitectura é orientada para uma lógica de alto débito de respostas do cluster, em detrimento de uma lógica de performance pura de uma máquina. Todas as máquinas estão ligadas por uma rede Ethernet a 100 Mbps com as ligações principais entre grupos de máquinas a chegarem aos 2Gbps. Não são usados esquemas complexos para redundância visto que esta é assegurada pela replicação intrínseca à própria arquitectura. PageRank. O PageRank é usado pelo Google para permitir ordenar por relevância os resultados de uma pesquisa. O algoritmo usado algoritmo interpreta um link de uma Página A para a Página B como um voto da Página A para a Página B [5], avaliando a importância de uma página pelos votos que ela recebe.[3][6] 3. Conclusões A solução apresentada pela Google, idealizada para o universo específico dos motores de busca, permite obter escalabilidade, fiabilidade e um elevado desempenho, tendo como base um cluster de máquinas comuns. No entanto, esta solução só é possível devido ao facto do problema dos motores de busca ter algumas propriedades especiais. Entre estas propriedades podemos destacar o facto de a maior parte das operações serem de leitura e de poderem ocorrer em paralelo. Em cenários que impliquem uma constante actualização ou inserção de dados, o software de controle e os processos de replicação dos dados pelas várias máquinas, teriam de ser bastante mais complexos. Apesar disso, há uma série de aplicações que podem beneficiar desta abordagem, como é o caso de servidores web que guardem grandes quantidades de informação e em que as escritas não sejam frequentes. Também repositórios de informação como bases de dados de artigos científicos, catálogos on-line de equipamentos, bibliotecas digitais on-line, podem beneficiar desta abordagem. Outras aplicações que não partilhem das características enunciadas podem beneficiar de soluções mistas. Para isso será necessário criar uma nova arquitectura, complementada com um software de gestão que permita a manutenção da coerência dos dados dentro do cluster, sem diminuir significativamente a performance.
4 Referências 1. Google Press Release (2004), Google Achieves Search Milestone With Immediate Access To More Than 6 Billion Items, lion.html 2. Barroso, L., Dean, J., Hölzle, U. (2003) Web Search For a Planet: The Google Cluster Architecture, IEEE Micro, March-April 2003, pp df 3. Brin, S., Page L. (1998) The Anatomy of a Large- Scale Hypertextual Web Search Engine, Proc. Seventh World Wide Web Conference 4. Sobek, M. Google Dance - The Index Update of the Google Search Engine 5. Google Inc. Technology Overview l 6. Rogers, I. (2002) The Google Pagerank Algorithm and How it Works, k Explained Correctly with Examples.htm
5 Ficha de Caracterização de Trabalho Título: Arquitectura de um motor de busca: exemplo do Google Resumo: Este artigo explica em modos gerais a arquitectura de um dos motores de busca mais populares actualmente, o Google. Pretende-se mostrar como uma aplicação que lida com um volume de dados gigantesco pode beneficiar de uma abordagem que envolve computação paralela e de bases de dados distribuídas. No fim são feitas algumas considerações sobre aplicações desta arquitectura a outros cenários. URL: Data: 19-Fev-2004 Esforço: Motivação: Conhecer o funcionamento de uma aplicação que trabalha com um volume de dados gigantesco e que, através de um cluster constituído por PCs normais consegue alcançar performances muito elevadas. Aprendizagem: Clusters, computação paralela, bases de dados distribuídas Conteúdos: Processos: (que procedimentos e comportamentos aprendeu) Futuro:
Apresentação do Artigo
Apresentação do Artigo Web Search for a Planet: The Google Cluster Architecture Publicado em IEEE Micro Março 2003, pg.22-28 Luiz A.Barroso, Jeffrey Dean, Urs Hölze Frank Juergen Knaesel fknaesel@inf.ufsc.br
Leia maisTECNOLOGIA WEB Aula 1 Evolução da Internet Profa. Rosemary Melo
TECNOLOGIA WEB Aula 1 Evolução da Internet Profa. Rosemary Melo Tópicos abordados Surgimento da internet Expansão x Popularização da internet A World Wide Web e a Internet Funcionamento e personagens da
Leia maisGUIÃO DE Protocolos em Redes de Dados. Ficha de Laboratório nº 1
GUIÃO DE Protocolos em Redes de Dados Ficha de Laboratório nº 1 Bruno Simões, Paulo Sousa, Fernando Vicente, Nuno Neves, Luís Rodrigues e Hugo Miranda DI-FCUL GU PRD 02 1 Março 2002 Departamento de Informática
Leia maisEAGLE TECNOLOGIA E DESIGN CRIAÇÃO DE SERVIDOR CLONE APCEF/RS
EAGLE TECNOLOGIA E DESIGN CRIAÇÃO DE SERVIDOR CLONE APCEF/RS Relatório Nº 03/2013 Porto Alegre, 22 de Agosto de 2013. ANÁLISE DE SOLUÇÕES: # RAID 1: O que é: RAID-1 é o nível de RAID que implementa o espelhamento
Leia maisINTERNET. TCP/IP protocolo de comunicação sobre o qual se baseia a Internet. (conjunto de regras para a comunicação entre computadores)
TCP/IP protocolo de comunicação sobre o qual se baseia a Internet. (conjunto de regras para a comunicação entre computadores) A cada computador integrado na rede é atribuído um número IP que o identifica
Leia maisCriação de Páginas Web - MS Word 2000
Gestão Comercial e da Produção Informática I 2003/04 Ficha de Trabalho N.º 9 Criação de Páginas Web - MS Word 2000 1. Criação de uma página Web (HTML): Escreva o seu texto e introduza as imagens pretendidas
Leia mais2 Diagrama de Caso de Uso
Unified Modeling Language (UML) Universidade Federal do Maranhão UFMA Pós Graduação de Engenharia de Eletricidade Grupo de Computação Assunto: Diagrama de Caso de Uso (Use Case) Autoria:Aristófanes Corrêa
Leia maisConstrução Páginas de Internet
Construção Páginas de Internet Definir um Site no Frontpage Objectivos da sessão: No final da sessão os formandos deverão ser capazes de: Saber o que são os metadados do Frontpage; Distinguir entre Sites
Leia maisProgramação para Internet I. 10. Motores de busca. Nuno Miguel Gil Fonseca nuno.fonseca@estgoh.ipc.pt
Programação para Internet I 10. Motores de busca Nuno Miguel Gil Fonseca nuno.fonseca@estgoh.ipc.pt A Internet assume-se como a maior fonte de informação de todos os tempos No entanto, a informação encontra-se
Leia maisMÓDULO MULTIMÉDIA. Text PROFESSOR: RICARDO RODRIGUES. MAIL: rprodrigues@escs.ipl.pt esganarel@gmail.com. URL: http://esganarel.home.sapo.
MÓDULO MULTIMÉDIA PROFESSOR: RICARDO RODRIGUES MAIL: rprodrigues@escs.ipl.pt esganarel@gmail.com URL: http://esganarel.home.sapo.pt Text GABINETE: 1G1 - A HORA DE ATENDIMENTO: SEG. E QUA. DAS 11H / 12H30
Leia maisInstituto Superior de Engenharia do Porto Administração de Sistemas Informáticos I Clusters
Instituto Superior de Engenharia do Porto Administração de Sistemas Informáticos I Clusters Trabalho elaborado por: 980368 - Sérgio Gonçalves Lima 1010949 - Nisha Sudhirkumar Chaganlal Clusters O que é
Leia maisSUMÁRIO 1. AULA 6 ENDEREÇAMENTO IP:... 2
SUMÁRIO 1. AULA 6 ENDEREÇAMENTO IP:... 2 1.1 Introdução... 2 1.2 Estrutura do IP... 3 1.3 Tipos de IP... 3 1.4 Classes de IP... 4 1.5 Máscara de Sub-Rede... 6 1.6 Atribuindo um IP ao computador... 7 2
Leia maisDepartamento de Informática
Departamento de Informática Licenciatura em Engenharia Informática Sistemas Distribuídos exame de recurso, 9 de Fevereiro de 2012 1º Semestre, 2011/2012 NOTAS: Leia com atenção cada questão antes de responder.
Leia maisCONCEITOS INICIAIS. Agenda A diferença entre páginas Web, Home Page e apresentação Web;
CONCEITOS INICIAIS Agenda A diferença entre páginas Web, Home Page e apresentação Web; O que é necessário para se criar páginas para a Web; Navegadores; O que é site, Host, Provedor e Servidor Web; Protocolos.
Leia maisEngenharia de Software Sistemas Distribuídos
Engenharia de Software Sistemas Distribuídos 2 o Semestre de 2009/2010 FEARSe Requisitos para a 1 a entrega 18 de Março de 2010 1 Introdução O projecto conjunto das disciplinas de Engenharia de Software
Leia maisWorld Wide Web. Disciplina de Informática PEUS, 2006 - U.Porto. Disciplina de Informática, PEUS 2006 Universidade do Porto
World Wide Web Disciplina de Informática PEUS, 2006 - U.Porto Redes de Comunicação Nos anos 60 surgem as primeiras redes locais destinadas à partilha de recursos fisicamente próximos (discos, impressoras).
Leia maisEntendendo como funciona o NAT
Entendendo como funciona o NAT Vamos inicialmente entender exatamente qual a função do NAT e em que situações ele é indicado. O NAT surgiu como uma alternativa real para o problema de falta de endereços
Leia maisAdmistração de Redes de Computadores (ARC)
Admistração de Redes de Computadores (ARC) Instituto Federal de Educação, Ciência e Tecnologia de Santa Catarina - Campus São José Prof. Glauco Cardozo glauco.cardozo@ifsc.edu.br RAID é a sigla para Redundant
Leia maisMultiplexador. Permitem que vários equipamentos compartilhem um único canal de comunicação
Multiplexadores Permitem que vários equipamentos compartilhem um único canal de comunicação Transmissor 1 Receptor 1 Transmissor 2 Multiplexador Multiplexador Receptor 2 Transmissor 3 Receptor 3 Economia
Leia maisBase de Dados para Administrações de Condomínios
Base de Dados para Administrações de Condomínios José Pedro Gaiolas de Sousa Pinto: ei03069@fe.up.pt Marco António Sousa Nunes Fernandes Silva: ei03121@fe.up.pt Pedro Miguel Rosário Alves: alves.pedro@fe.up.pt
Leia maisManual de Utilizador. Disciplina de Projecto de Sistemas Industriais. Escola Superior de Tecnologia. Instituto Politécnico de Castelo Branco
Escola Superior de Tecnologia Instituto Politécnico de Castelo Branco Departamento de Informática Curso de Engenharia Informática Disciplina de Projecto de Sistemas Industriais Ano Lectivo de 2005/2006
Leia mais10/07/2013. Camadas. Principais Aplicações da Internet. Camada de Aplicação. World Wide Web. World Wide Web NOÇÕES DE REDE: CAMADA DE APLICAÇÃO
2 Camadas NOÇÕES DE REDE: CAMADA DE APLICAÇÃO Introdução à Microinformática Prof. João Paulo Lima Universidade Federal Rural de Pernambuco Departamento de Estatística e Informática Aplicação Transporte
Leia maisServidores Virtuais. Um servidor à medida da sua empresa, sem investimento nem custos de manutenção.
es Virtuais Um servidor à medida da sua empresa, sem investimento nem custos de manutenção. O que são os es Virtuais? Virtual é um produto destinado a empresas que necessitam de um servidor dedicado ligado
Leia maisArquitecturas de Software Licenciatura em Engenharia Informática e de Computadores
UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR TÉCNICO Arquitecturas de Software Licenciatura em Engenharia Informática e de Computadores Primeiro Teste 21 de Outubro de 2006, 9:00H 10:30H Nome: Número:
Leia maisUtilização da rede e- U/eduroam por utilizadores Convidados. Serviço Utilizador RCTS Fevereiro de 2010
Utilização da rede e- U/eduroam por utilizadores Convidados Serviço Utilizador RCTS Fevereiro de 2010 5 de Fevereiro de 2010 Utilização da rede e- U/eduroam por utilizadores Convidados Serviço Utilizador
Leia maisConsistência Eventual - Sistemas Distribuidos e Tolerância a Falhas
Consistência Eventual Sistemas Distribuidos e Tolerância a Falhas Marco Bernardo Departamento de Informática Universidade da Beira Interior 25 de Maio de 2009 Descrição Geral 1 Introdução O Problema Definições
Leia maisGereComSaber. Disciplina de Desenvolvimento de Sistemas de Software. Sistema de Gestão de Serviços em Condomínios
Universidade do Minho Conselho de Cursos de Engenharia Licenciatura em Engenharia Informática 3ºAno Disciplina de Desenvolvimento de Sistemas de Software Ano Lectivo de 2009/2010 GereComSaber Sistema de
Leia mais09/05/2012. O Professor Plano de Disciplina (Competências, Conteúdo, Ferramentas Didáticas, Avaliação e Bibliografia) Frequência Nota Avaliativa Site:
O Professor Plano de Disciplina (Competências, Conteúdo, Ferramentas Didáticas, Avaliação e Bibliografia) Frequência Nota Avaliativa Site: https://sites.google.com/site/professorcristianovieira Esta frase
Leia maisINSTITUTO PRESBITERIANO MACKENZIE COLÉGIO PRESBITERIANO MACKENZIE SP Informática Educacional
História da Internet...3 O que é Internet?...3 Quem é o dono da Internet?...3 Como se conectar?...4 A estrutura dos endereços utilizados na Internet...4 SITES DE BUSCA...7 Sites de Busca...8 Pesquisa...8
Leia maisCAPÍTULO 2. Este capítulo tratará :
1ª PARTE CAPÍTULO 2 Este capítulo tratará : 1. O que é necessário para se criar páginas para a Web. 2. A diferença entre páginas Web, Home Page e apresentação Web 3. Navegadores 4. O que é site, Host,
Leia maisSISTEMAS DISTRIBUÍDOS
SISTEMAS DISTRIBUÍDOS Cluster, Grid e computação em nuvem Slide 8 Nielsen C. Damasceno Introdução Inicialmente, os ambientes distribuídos eram formados através de um cluster. Com o avanço das tecnologias
Leia maisAvanços na transparência
Avanços na transparência A Capes está avançando não apenas na questão dos indicadores, como vimos nas semanas anteriores, mas também na transparência do sistema. Este assunto será explicado aqui, com ênfase
Leia maisOrganizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU
Organizaçãoe Recuperaçãode Informação GSI521 Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Análisede links Page Rank Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Motivação Suponha que um modelo clássico, como
Leia maisVirtualização e Consolidação de Centro de Dados O Caso da UTAD António Costa - acosta@utad.pt
Universidade de Trás-os-Montes e Alto Douro Virtualização e Consolidação de Centro de Dados O Caso da UTAD António Costa - acosta@utad.pt Agenda A UTAD Virtualização Uma definição Introdução e abrangência
Leia maisProfs. Deja e Andrei
Disciplina Sistemas Distribuídos e de Tempo Real Profs. Deja e Andrei Sistemas Distribuídos 1 Conceitos e Projetos de Sistemas Distribuídos Objetivos: Apresentar uma visão geral de processamento distribuído,
Leia mais1º Seminário de Software Livre Tchelinux Software Livre: leve adiante esta idéia. Soluções de Web Caching e Web Acceleration
1º Seminário de Software Livre Tchelinux Software Livre: leve adiante esta idéia Soluções de Web Caching e Web Acceleration Domingos Parra Novo domingosnovo@terra.com.br Tópicos Introdução O que são web
Leia maisAlta Disponibilidade na IPBRICK
Alta Disponibilidade na IPBRICK IPBRICK International 5 de Dezembro de 2012 1 Conteúdo 1 Introdução 3 1.1 Vantagens.................................... 3 2 Requisitos HA 4 3 Configuração HA 4 3.1 Serviço
Leia maisProcedimentos para a divulgação de eventos no site da ECUM
Procedimentos para a divulgação de eventos no site da ECUM Pressupostos introdutórios 3 Descrição da tarefa 4 Autenticação/Login 4 Página de entrada 4 Criar um novo evento 5 Colocar um evento em destaque
Leia maisPLANO DE ESTUDOS DE T.I.C. 7.º ANO
DE T.I.C. 7.º ANO Ano Letivo 2015 2016 PERFIL DO ALUNO O aluno deve ser capaz de: - desenvolver capacidades na utilização das tecnologias de informação e comunicação que permitam uma literacia digital
Leia maisEscola Superior de Tecnologia de Setúbal. Projecto Final
Instituto Politécnico de Setúbal Escola Superior de Tecnologia de Setúbal Departamento de Sistemas e Informática Projecto Final Computação na Internet Ano Lectivo 2002/2003 Portal de Jogos Executado por:
Leia maisArmazenamento em nuvem é feito em serviços que poderão ser acessados de diferentes lugares, a qualquer momento e utilizando diferentes dispositivos,
Nuvem cloud Armazenamento em nuvem é feito em serviços que poderão ser acessados de diferentes lugares, a qualquer momento e utilizando diferentes dispositivos, não havendo necessidade de armazenamento
Leia maisMÓDULO 8 ARQUITETURA DOS SISTEMAS DE BANCO DE DADOS
MÓDULO 8 ARQUITETURA DOS SISTEMAS DE BANCO DE DADOS Quando falamos em arquitetura, normalmente utilizamos esse termo para referenciar a forma como os aplicativos computacionais são estruturados e os hardwares
Leia maisÉ uma rede mundial de computadores ligados entre si. INTERNET
INTERNET O QUE É A INTERNET? O QUE É NECESSÁRIO PARA ACEDER À INTERNET? QUAL A DIFERENÇA ENTRE WEB E INTERNET? HISTÓRIA DA INTERNET SERVIÇOS BÁSICOS DA INTERNET 2 1 INTERCONNECTED NETWORK INTERNET A Internet
Leia maisUM NOVO CONCEITO EM HOSPEDAGEM DE DOMÍNIO
www.origy.com.br UM NOVO CONCEITO EM HOSPEDAGEM DE DOMÍNIO CARACTERÍSTICAS: E-MAIL IMAP * Acesso simultâneo e centralizado, via aplicativo, webmail e celular/smartphone * Alta capacidade de armazenamento
Leia maisProgramação para a Web - I. José Humberto da Silva Soares
Programação para a Web - I José Humberto da Silva Soares Fundamentos de Internet Rede Mundial de Computadores; Fornece serviços, arquivos e informações; Os computadores que têm os recursos são chamados
Leia maisTECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO - TIC 10º C. Planificação de. Curso Profissional de Técnico de Secretariado
Escola Básica e Secundária de Velas Planificação de TECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO - TIC Curso Profissional de Técnico de Secretariado 10º C MÓDULO 1 FOLHA DE CÁLCULO Microsoft Excel Conteúdos
Leia maisUFG - Instituto de Informática
UFG - Instituto de Informática Especialização em Desenvolvimento de Aplicações Web com Interfaces Ricas EJB 3.0 Prof.: Fabrízzio A A M N Soares professor.fabrizzio@gmail.com Aula 13 Web Services Web Services
Leia maisWSUS. Windows Server Update Services
WSUS Windows Server Update Services WSUS Permite gerenciar de forma centralizada, ou distribuída as atualizações de software Atualizações de software automáticas oferecidas pelo windows update são importantes
Leia maisMinistério das Finanças Instituto de Informática. Departamento de Sistemas de Informação
Ministério das Finanças Instituto de Informática Departamento de Sistemas de Informação Assiduidade para Calendários Específicos Junho 2010 Versão 6.0-2010 SUMÁRIO 1 OBJECTIVO 4 2 ECRÃ ELIMINADO 4 3 NOVOS
Leia maisTópicos Especiais em Informática
Tópicos Especiais em Informática RAID Prof. Ms.-Eng. Igor Sousa Faculdade Lourenço Filho 1 de outubro de 2014 igorvolt@gmail.com (FLF) Tópicos Especiais em Informática 1 de outubro de 2014 1 / 14 Introdução
Leia maisProf.: MARCIO HOLLWEG mhollweg@terra.com.br
INFORMÁTICA Prof.: MARCIO HOLLWEG mhollweg@terra.com.br CONCEITOS DE INTERNET E INTRANET CONCEITOS DE INTERNET E INTRANET INTERNET => CONJUNTO DE REDES LIGANDO COMPUTADORES MUNDO A FORA. INTRANET => REDE
Leia maisItinerários de Ônibus Relatório Final
CENTRO UNIVERSITÁRIO SENAC Itinerários de Ônibus Relatório Final Grupo 5 Caio Roque Daniel Nunes Elise Roese José Caneiro Marcos Grignani São Paulo Junho de 2007 1 ÍNDICE 1. Introdução... 3 2. Desenvolvimento...
Leia maisFERRAMENTAS E SOLUÇÕES DE APOIO À GESTÃO E MANUTENÇÃO DE ATIVOS
FERRAMENTAS E SOLUÇÕES DE APOIO À GESTÃO E MANUTENÇÃO DE ATIVOS Ivo BRAGA 1 RESUMO Os Serviços de manutenção exigem cada vez mais um elevado nível de complexidade. Mesmo a nível local onde o grau de especialização
Leia maisGrande conjunto de informação que existe em todo o Mundo alojada em centenas de milhares de computadores chamados servidores Web.
1. Complete a tabela. Designação Descrição Rede mundial de computadores ligados entre si através de linhas telefónicas comuns, linhas de comunicação privadas, satélites e outros serviços de telecomunicação.
Leia maisinternet http://www.uarte.mct.pt internet... abrir o programa... pag.. 6 ecrã do internet explorer... ligações... escrever um endereço de internet...
internet 1 http://www.uarte.mct. internet...... pag.. 2 abrir o programa...... pag.. 3 ecrã do internet explorer... pag.. 4 ligações...... pag.. 5 escrever um endereço de internet... pag.. 6 voltar à página
Leia maisSistemas Multimédia. Arquitectura Protocolar Simples Modelo OSI TCP/IP. Francisco Maia famaia@gmail.com. Redes e Comunicações
Sistemas Multimédia Arquitectura Protocolar Simples Modelo OSI TCP/IP Redes e Comunicações Francisco Maia famaia@gmail.com Já estudado... Motivação Breve História Conceitos Básicos Tipos de Redes Componentes
Leia maisINTERNET CONCEITOS. Internet é a "grande rede mundial de computadores"
INTERNET CONCEITOS O que é Internet Estamos acostumados a ouvir que Internet é a "grande rede mundial de computadores" Entretanto, essa definição não é muito simplista. Na realidade, Ela é uma coleção
Leia maisO que é RAID? Tipos de RAID:
O que é RAID? RAID é a sigla para Redundant Array of Independent Disks. É um conjunto de HD's que funcionam como se fosse um só, isso quer dizer que permite uma tolerância alta contra falhas, pois se um
Leia maisSistemas Informáticos
Sistemas Informáticos Sistemas Distribuídos Eng.ª Sistemas de Informação Escola Superior de Tecnologia e Gestão - IPVC Ano Lectivo 2005-2006 1.º Semestre Gestão de Nomes 1 - Objectivos - Os nomes são fundamentais
Leia maisA VISTA BACKSTAGE PRINCIPAIS OPÇÕES NO ECRÃ DE ACESSO
DOMINE A 110% ACCESS 2010 A VISTA BACKSTAGE Assim que é activado o Access, é visualizado o ecrã principal de acesso na nova vista Backstage. Após aceder ao Access 2010, no canto superior esquerdo do Friso,
Leia maisWeb Design Aula 11: Site na Web
Web Design Aula 11: Site na Web Professora: Priscilla Suene priscilla.silverio@ifrn.edu.br Motivação Criar o site em HTML é interessante Do que adianta se até agora só eu posso vê-lo? Hora de publicar
Leia maisRAID. Propõe o aumento da confiabilidade e desempenho do armazenamento em disco. RAID (Redundant Array of Independent Disks )
RAID O que é um RAID? RAID RAID (Redundant Array of Independent Disks ) Matriz Redundante de Discos Independentes Propõe o aumento da confiabilidade e desempenho do armazenamento em disco. RAID Surgiu
Leia maisISEP. Instituto Superior de Engenharia do Porto. Análise de Sistemas Informáticos
ISEP Instituto Superior de Engenharia do Porto Análise de Sistemas Informáticos Armazenamento de Dados em Rede A Revolução do Armazenamento Partilhado A crise económica e a crescente necessidade de armazenamento
Leia maisFaculdades Santa Cruz - Inove. Plano de Aula Base: Livro - Distributed Systems Professor: Jean Louis de Oliveira.
Período letivo: 4 Semestre. Quinzena: 5ª. Faculdades Santa Cruz - Inove Plano de Aula Base: Livro - Distributed Systems Professor: Jean Louis de Oliveira. Unidade Curricular Sistemas Distribuídos Processos
Leia maisUNIVERSIDADE CATÓLICA PORTUGUESA
UNIVERSIDADE CATÓLICA PORTUGUESA FACULDADE DE PSICOLOGIA E DE EDUCAÇÃO MESTRADO EM CIÊNCIAS DA EDUCAÇÃO ESPECIALIZAÇÃO EM INFORMÁTICA EDUCACIONAL Internet e Educação Ensaio: A Web 2.0 como ferramenta pedagógica
Leia maisProjeto Você pede, eu registro.
Projeto Você pede, eu registro. 1) IDENTIFICAÇÃO 1.1) Título do Projeto: Você pede eu registro. 1.2) Equipe responsável pela coordenação do projeto: Pedro Paulo Braga Bolzani Subsecretario de TI Antonio
Leia mais481040 - Programador/a de Informática
481040 - Programador/a de Informática UFCD - 0801 ADMINISTRAÇÃO DE REDES LOCAIS Sessão 1 SUMÁRIO Backups eficientes; Armazenar Backups; Restaurar do zero; Testar Backups; Backups eficientes 1. Etiquetar
Leia maisA SÈTIMA. O nosso principal objectivo
03 A SÈTIMA A SÉTIMA produz soluções de software maioritariamente com recurso à WEB, de modo a dar suporte ao crescimento tecnológico que é já a maior realidade do século XXI. Esta aposta deve-se ao facto
Leia maisIntrodução à Tecnologia Web. Tipos de Sites. Profª MSc. Elizabete Munzlinger www.elizabete.com.br
IntroduçãoàTecnologiaWeb TiposdeSites ProfªMSc.ElizabeteMunzlinger www.elizabete.com.br ProfªMSc.ElizabeteMunzlinger www.elizabete.com.br TiposdeSites Índice 1 Sites... 2 2 Tipos de Sites... 2 a) Site
Leia maisDesenvolvendo Websites com PHP
Desenvolvendo Websites com PHP Aprenda a criar Websites dinâmicos e interativos com PHP e bancos de dados Juliano Niederauer 19 Capítulo 1 O que é o PHP? O PHP é uma das linguagens mais utilizadas na Web.
Leia maisLIÇÃO Interacção na Internet - Web 2.0
LIÇÃO Interacção na Internet - Web 2.0 Idade-alvo recomendada: 11 anos Guia da lição Os alunos irão desenvolver uma compreensão básica das considerações de segurança envolvidas na comunicação online. Objectivos
Leia maisREDES DE COMPUTADORES
REDES DE COMPUTADORES Placas de Rede Modems Hubs e switches Router Prof. Hugo Rosa PLACAS DE REDE As placas de rede são periféricos de entrada e saída e são utilizadas para interligar um computador a uma
Leia maisINFORMÁTICA FUNDAMENTOS DE INTERNET. Prof. Marcondes Ribeiro Lima
INFORMÁTICA FUNDAMENTOS DE INTERNET Prof. Marcondes Ribeiro Lima Fundamentos de Internet O que é internet? Nome dado a rede mundial de computadores, na verdade a reunião de milhares de redes conectadas
Leia maisDESENVOLVER E GERIR COMPETÊNCIAS EM CONTEXTO DE MUDANÇA (Publicado na Revista Hotéis de Portugal Julho/Agosto 2004)
DESENVOLVER E GERIR COMPETÊNCIAS EM CONTEXTO DE MUDANÇA (Publicado na Revista Hotéis de Portugal Julho/Agosto 2004) por Mónica Montenegro, Coordenadora da área de Recursos Humanos do MBA em Hotelaria e
Leia maisComo Criar Sites Grátis de Sucesso
Truques e Dicas Como Criar Sites Grátis de Sucesso Tudo o Que Precisa Para Ter Sucesso na Internet Gratuitamente! INTRODUÇÃO... 2 COMO ESCOLHER O TEMA DO SITE... 4 DICAS PARA REGISTAR UM DOMÍNIO... 5 COMO
Leia maisModelo Cascata ou Clássico
Modelo Cascata ou Clássico INTRODUÇÃO O modelo clássico ou cascata, que também é conhecido por abordagem top-down, foi proposto por Royce em 1970. Até meados da década de 1980 foi o único modelo com aceitação
Leia maisDocumentação sobre a Tecnologia RAID
Documentação sobre a Tecnologia RAID Enquanto especialista no armazenamento de dados, a LaCie reconhece que quase todos os utilizadores de computadores irão necessitar de uma solução de cópia de segurança
Leia mais1 2 3 W O R K S H O P 4 5 6 W O R K S H O P 7 W O R K S H O P 8 9 10 Instruções gerais para a realização das Propostas de Actividades Para conhecer em pormenor o INTERFACE DO FRONTPAGE clique aqui 11 CONSTRUÇÃO
Leia maisEA960 Redundância e Confiabilidade: RAID
EA960 Redundância e Confiabilidade: RAID Faculdade de Engenharia Elétrica e de Computação (FEEC) Universidade Estadual de Campinas (UNICAMP) Prof. Levy Boccato 1 Motivação Revisitando a lei de Amdahl:
Leia maisRede de Computadores
Escola de Ciências e Tecnologia UFRN Rede de Computadores Prof. Aquiles Burlamaqui Nélio Cacho Luiz Eduardo Eduardo Aranha ECT1103 INFORMÁTICA FUNDAMENTAL Manter o telefone celular sempre desligado/silencioso
Leia maisRelatório de Instalação do Windows 2003 Server
Curso Profissional de Gestão e Programação de Sistemas Informáticos Relatório de Instalação do Windows 2003 Server Instalação do Windows 2003 Server quarta-feira, 3 de dezembro de 2013 Índice Introdução...
Leia maisDEPARTAMENTO DE ENGENHARIA INFORMÁTICA FACULDADE DE CIÊNCIAS E TECNOLOGIA DA UNIVERSIDADE DE COIMBRA
DEPARTAMENTO DE ENGENHARIA INFORMÁTICA FACULDADE DE CIÊNCIAS E TECNOLOGIA DA UNIVERSIDADE DE COIMBRA Sistemas Operativos 2003/2004 Trabalho Prático #2 -- Programação em C com ponteiros -- Objectivos Familiarização
Leia maisServidor Proxy armazenamento em cache.
Servidor Proxy Servidor Proxy Um modo bastante simples de melhorar o desempenho de uma rede é gravar páginas que foram anteriormente acessadas, caso venham a ser solicitadas novamente. O procedimento de
Leia maisBANCO DE DADOS CONTEÚDO INFORMÁTICA. Prof.: MARCIO HOLLWEG mhollweg@terra.com.br BANCO DE DADOS SGBD TABELA CONCEITOS BÁSICOS
CONTEÚDO HARDWARE - 2 AULAS SISTEMA OPERACIONAL - 2 AULAS INFORMÁTICA Prof.: MARCIO HOLLWEG mhollweg@terra.com.br APLICATIVOS OFFICE - 3 AULAS INTERNET - 1 AULA REDE - 2 AULA SEGURANÇA - 1 AULA BANCO DE
Leia maisDirecção Regional de Educação do Algarve
MÓDULO 1 Folha de Cálculo 1. Introdução à folha de cálculo 1.1. Personalização da folha de cálculo 1.2. Estrutura geral de uma folha de cálculo 1.3. O ambiente de da folha de cálculo 2. Criação de uma
Leia mais... Calendarização: 2 blocos de 90 m Metas/Objetivos Descritores Conceitos/Conteúdos Estratégias/Metodologias Avaliação
DEPARTAMENTO DE MATEMÁTICA E INFORMÁTICA DISCIPLINA: TECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO PLANIFICAÇÃO DE 7º ANO... 1º Período Domínio INFORMAÇÃO I7 A Informação, o conhecimento e o mundo das tecnologias
Leia maisVORONOI STATE MANAGEMENT FOR PEER-TO-PEER MASSIVELY MULTIPLAYER ONLINE GAMES
VORONOI STATE MANAGEMENT FOR PEER-TO-PEER MASSIVELY MULTIPLAYER ONLINE GAMES Juan J. Jaramillo, Fabio Milan, R. Srikant, Department of Computer Science and Information Engineering National Central University,
Leia maisIntrodução aos Computadores
Os Computadores revolucionaram as formas de processamento de Informação pela sua capacidade de tratar grandes quantidades de dados em curto espaço de tempo. Nos anos 60-80 os computadores eram máquinas
Leia maisMúltiplos Estágios processo com três estágios Inquérito de Satisfação Fase II
O seguinte exercício contempla um processo com três estágios. Baseia-se no Inquérito de Satisfação Fase II, sendo, por isso, essencial compreender primeiro o problema antes de começar o tutorial. 1 1.
Leia maisEQUIPE: ANA IZABEL DAYSE FRANÇA JENNIFER MARTINS MARIA VÂNIA RENATA FREIRE SAMARA ARAÚJO
UNIVERSIDADE FEDERAL DA PARAIBA DEPARTAMENTO DE CIÊNCIA DA INFORMAÇÃO CENTRO DE CIÊNCIAS SOCIAIS APLICADAS CURSO DE GRADUAÇÃO EM BIBLIOTECONOMIA DISCIPLINA: TECNOLOGIA DA INFORMAÇÃO II PROFESSORA: PATRÍCIA
Leia maisPESQUISA SOBRE O PERFIL DE ALUNOS NA UTILIZAÇÃO DE UM SITE DOCENTE DO ENSINO SUPERIOR
PESQUISA SOBRE O PERFIL DE ALUNOS NA UTILIZAÇÃO DE UM SITE DOCENTE DO ENSINO SUPERIOR Wesley Humberto da Silva (Fundação Araucária), André Luis Andrade Menolli (Orientador) e-mail: wesleyhumberto11@mail.com
Leia maisProposta. Atribuição de endereços IPv6 na UTL
Proposta Atribuição de endereços IPv6 na UTL 1 Introdução Esta proposta pretende definir um esquema racional de atribuição de endereços IPv6 aos diversos organismos da UTL com vista a resolver à partida
Leia mais1 http://www.google.com
1 Introdução A computação em grade se caracteriza pelo uso de recursos computacionais distribuídos em várias redes. Os diversos nós contribuem com capacidade de processamento, armazenamento de dados ou
Leia maisPHC Serviços CS. A gestão de processos de prestação de serviços
PHC Serviços CS A gestão de processos de prestação de serviços A solução que permite controlar diferentes áreas de uma empresa: reclamações e respectivo tratamento; controlo de processos e respectivos
Leia maisTarefa Orientada 16 Vistas
Tarefa Orientada 16 Vistas Objectivos: Vistas só de leitura Vistas de manipulação de dados Uma vista consiste numa instrução de SELECT que é armazenada como um objecto na base de dados. Deste modo, um
Leia maisEVOLUÇÃO DOS SIST. DE COMPUTAÇÃO DÉC. DE 50 E 60
INTRODUÇÃO REDES EVOLUÇÃO DOS SIST. DE COMPUTAÇÃO DÉC. DE 50 E 60 Computadores eram máquinas grandes e complexas, operadas por pessoas altamente especializadas; Não havia interação direta entre usuários
Leia maisP HC XL - Nem calcula o produto que temos para si...
P HC XL - Nem calcula o produto que temos para si... Documento FAQs Poderão ser contemplados campos de utilizadores da ML? Essa possibilidade não existe. Os campos disponíveis são os campos base da tabela
Leia maisXDOC. Solução otimizada para armazenamento e recuperação de documentos
XDOC Solução otimizada para armazenamento e recuperação de documentos ObJetivo Principal O Que você ACHA De ter Disponível Online todos OS Documentos emitidos por SUA empresa em UMA intranet OU Mesmo NA
Leia mais