Boas Práticas em Sistemas Web muito além do HTML...

Documentos relacionados

Observatório da Web: Uma Plataforma para Monitoramento de Eventos em Tempo Real. Gisele L. Pappa Outubro/2013

Faculdade Integrada do Ceará FIC Graduação em Redes de Computadores

A computação na nuvem é um novo modelo de computação que permite ao usuário final acessar uma grande quantidade de aplicações e serviços em qualquer

EMENTAS DAS DISCIPLINAS

MBA Analytics em Big Data

PROGRAMAÇÃO PARA INTERNET RICA RICH INTERNET APPLICATIONS

ANEXO 11. Framework é um conjunto de classes que colaboram para realizar uma responsabilidade para um domínio de um subsistema da aplicação.

Prof. Daniela Barreiro Claro

SISTEMAS DISTRIBUÍDOS

E SE VOCÊ PUDESSE EXTRAIR INTELIGÊNCIA DO CONTEÚDO PRODUZIDO SOBRE SUA MARCA OU PRODUTO NAS MÍDIAS SOCIAIS?

Proposta Revista MARES DE MINAS

Laboratório de Mídias Sociais

Prof. Daniela Barreiro Claro

EMENTAS DAS DISCIPLINAS

Apresenta. SofStore o mais novo aliado no gerenciamento do seu negócio

ANEXO Conteúdos em formato de texto puro e listas; - Conteúdos em formato de texto puro e conteúdo categorizado;

<apresentação institucional> <junho, 2015>

CONCEITOS E APLICAÇÕES DA COMPUTAÇÃO EM NUVEM

O que é a ciência de dados (data science). Discussão do conceito. Luís Borges Gouveia Universidade Fernando Pessoa Versão 1.

UFF-Fundamentos de Sistemas Multimídia. Redes de Distribuição de Conteúdo (CDN)

Introdução ao Modelos de Duas Camadas Cliente Servidor

Minicurso Computação em Nuvem Prática: Openstack

Este é o NOSSO TEMPO. Desfrutar. Aprender. Criar. Compartilhar Novos relacionamentos

CIDADE PARTICIPATIVA O GOVERNO FORA DA CAIXA

Monitoramento de Redes Sociais

WordPress Desenvolvimento de Sites e Redes Sociais. Vinicius Massuchetto vinicius.soylocoporti.org.br

O que é o Virto ERP? Onde sua empresa quer chegar? Apresentação. Modelo de funcionamento

EMENTAS DAS DISCIPLINAS

O que é a BuenitStore

Análise dos Navegadores de Internet

perspectivas e abordagens típicas de campos de investigação (Senra & Camargo, 2010).

Instituto de Educação Tecnológica Pós-graduação Gestão em Tecnologia da Informação - Turma nº 25 08/04/2015. Computação em Nuvem

Web Analytics (Google analytics, Web trafic XITI, Coremetrics, etc.); Ferramentas de gestão de listas de s (Mailchimp, constant contact, etc.

PROPOSTA DE CRIAÇÃO E DESENVOLVIMENTO DE WEBSITE

Avaliação e Monitoramento de Redes Sociais

Detecção e investigação de ameaças avançadas. INFRAESTRUTURA

Sistemas Distribuídos. Fundamentos. Nazareno Andrade. Universidade Federal de Campina Grande 02/2008

Prof. Daniela Barreiro Claro

Projeto de Sistemas Distribuídos. Prof. Andrêza Leite

Práticas de Desenvolvimento de Software

SEMINÁRIO ABMES BASES DO MARKETING DIGITAL. Expositor. Júlio César de Castro Ferreira

MBA Inteligência Competitiva Com ênfase em BI/CPM. Metadados

Esclarecimento: As versões dos navegadores a serem utilizadas pelo PSIM estão descrito no item do projeto básico.

INTEGRE Diversas fontes de informações em uma interface intuitiva que exibe exatamente o que você precisa

Curso Superior de Tecnologia em Análise e Desevolvimento de Sistemas CÂMPUS GASPAR

Proposta Concessionária Terra Nova Land Rover

Tendências de Tecnologia. IV Workshop de TI

} Monolíticas Aplicações em um computador centralizado. } Em Rede Aplicações com comunicação em rede. } Distribuídas Comunicação e cooperação em rede

COMPUTAÇÃO EM NUVEM: UM FUTURO PRESENTE

Estratégias do Governo Federal para as Mídias Sociais. Marcia Pachaly Coordenadora de internet

O futuro da área de finanças Simplificação, eficiência e produtividade. Othon de Almeida 1 de julho de 2015

Entrar neste site/arquivo e estudar esse aplicativo Prof. Ricardo César de Carvalho

DESENVOLVENDO APLICAÇÃO UTILIZANDO JAVA SERVER FACES

DATA WAREHOUSE. Introdução

SIMARPE Sistema de Arquivo Permanente

Roteiro para a escrita do documento de Especificação de Requisitos de Software (ERS)

Intranets. FERNANDO ALBUQUERQUE Departamento de Ciência da Computação Universidade de Brasília 1.INTRODUÇÃO

Aula 1: Introdução à Disciplina Fonte: Plano de Aula Oficial da Disciplina

Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro V

Fabiola Rizzo Sanchez José Carlos Balbino Rosa Eliane Aparecida Souza Cruz Gildete de Oliveira Batista

Introdução a Computação nas Nuvens

Introdução à Computação

Arquitetura da Informação Lílian Simão Oliveira

23/05/12. Computação em Nuvem. Computação em nuvem: gerenciamento de dados. Computação em Nuvem - Características principais

Programação com acesso a BD. Prof.: Clayton Maciel Costa clayton.maciel@ifrn.edu.br

Os desafios do Bradesco nas redes sociais

LINGUAGEM DE BANCO DE DADOS

Gerência de Redes. Arquitetura de Gerenciamento.

Windows 2008 Server. Windows 2008 Server IFSP Boituva Prof. Sérgio Augusto Godoy.

Introdução aos Sistemas Operacionais. Computador = hardware + software. Como é formado o meu computador? E como estes componentes se comunicam?

Sistemas de Informação I

Genio desafios. O Genio entre os novos paradigmas da engenharia do software. quidgest@quidgest.com

Como e por onde começar e os melhores formatos de conteúdo para você

Tabela de Preços Sugeridos

Desenvolvendo Websites com PHP

Banco de Dados Orientado a Objetos

João Víctor Rocon Maia Engenharia de Computação - UFES

Disciplina de Banco de Dados Introdução

Arquitetura dos Sistemas de Informação Distribuídos

SISTEMA DE AGENDAMENTO E GERENCIAMENTO DE CONSULTAS CLÍNICAS

Patrício Domingues Dep. Eng. Informática ESTG Instituto Politécnico de Leiria Leiria, Maio

Frankfurt. Porto. Madrid. Lisboa. Mexico. Recife. São Paulo

NOVAS MÍDIAS DIGITAIS - AULA 01 - APRESENTAÇÃO

Sorocaba 05 de Agosto de Para: takestore. A/C: takestore Referente: Desenvolvimento Site Institucional. Prezado(a) Sr(a)

CRM: uma nova perspectiva da gestão do relacionamento com o cliente

ArquiteturadaInformação. Lílian Simão Oliveira

Atualizado em Março de 2014

Faculdade de Tecnologia SENAC Goiás. Disciplina: Gerenciamento de Rede de Computadores. Goiânia, 16 de novembro de 2014.

SERVIÇO DE ANÁLISE DE REDES DE TELECOMUNICAÇÕES APLICABILIDADE PARA CALL-CENTERS VISÃO DA EMPRESA

Sistemas de Informações Gerenciais Prof. Esp. André Luís Belini Bacharel em Sistemas de Informações MBA em Gestão Estratégica de Negócios

Anexo I Formulário para Proposta

AGENDA. O Portal Corporativo. Arquitetura da Informação. Metodologia de Levantamento. Instrumentos Utilizados. Ferramentas

A consolidação de servidores traz uma séria de vantagens, como por exemplo:

Transcrição:

Boas Práticas em Sistemas Web muito além do HTML... Adriano C. Machado Pereira (adrianoc@dcc.ufmg.br)

De que Web estamos falando?

De que Web estamos falando? A Web foi concebida para ser uma biblioteca

De que Web estamos falando? Enorme sucesso e popularização; Inúmeros desafios para prover serviços com qualidade; Imensa quantidade de informação, que continua a aumentar; Web 2.0: maior dinamismo e interação, novas redes temáticas e serviços; Necessidade constante de criar, aperfeiçoar e inovar seus serviços.

De que Web estamos falando? Evolução da Web

De que Web estamos falando? Evolução da Web

De que Web estamos falando? Web 1.0, 2.0, 3.0, x.0???

De que Web estamos falando? Linha do tempo da Web

De que Web estamos falando? Camada de Interação Usuários e diversas redes de relacionamentos sociais formadas a partir de serviços da Web. 10

De que Web estamos falando? Camada de Serviços Diversas funcionalidades e integração dos serviços da Web, bem como as atividades de tratamento da informação; 11

De que Web estamos falando? Componentes de hardware e de software - infraestrutura básica de execução de serviços da Web. Camada de Infra-Estrutura 12

De que Web estamos falando? Visão unificada da Web: Redes são dinâmicas, evoluindo com o tempo em resposta a: Como as pessoas se comportam; Disponibilização de novos serviços e conteúdo; Falhas (propositais ou não) em componentes de software e hardware. Redes são interdependentes: Alterações em qualquer camada podem causar impacto significativo nas demais. 13

De que Web estamos falando? Web: mais complexo, popular e dinâmico sistema computacional distribuído; Diversidade de serviços e perfis de usuário; Grande volume de dados. 14

De que Web estamos falando?

De que Web estamos falando? Volume (escala) Desde o início de nossa civilização até 2003: 5 exabytes Atualmente, produzimos 5 exabytes a cada 2 dias Termos como brontobyte (27 zeros), começam a aparecer

De que Web estamos falando? Variedade (complexidade) O real valor está na combinação de diferentes tipos de dados, e diferentes fontes de dados +80% dos dados produzidos são nãoestruturados

De que Web estamos falando?

De que Web estamos falando? Sensores? Google: sabe o que queremos ou pensamos Facebook: sabe do que gostamos Skype: sabe com quem falamos Foursquare: sabe para onde vamos Twitter: sabe como estamos nos sentimos Instagram: sabe o que vestimos Amazon: sabe o que compramos Isso não é assustador? É legal? Ético? Cruzamentos?

Boas práticas em termos de quê?

Observatório da Web Desafios: Grandes volumes de dados (Big Data); Extração da informação a partir dos dados; Heterogeneidade de formatos e fontes; Incerteza, subjetividade e ambiguidade;

Observatório da Web Desafios: Precisão e abrangência dos dados; Evolução de padrões ao longo do tempo; Cenário dinâmico e demanda em tempo real; Constante evolução tecnológica. Como lidar com tudo isto?

Boas práticas em termos de quê? Arquitetura Pipeline de processamento Processamento de fluxos (data streaming) Tecnologias Diversidade de ferramentas, frameworks, linguagens de programação Interoperabilidade Diferentes dispositivos e tipos de sistemas Computação ubíqua API

Boas práticas em termos de quê? Desempenho computacional e escalabilidade Variação da carga de uso do sistema Necessidade de elasticidade Usabilidade e visualização de dados Visualizações estáticas versus dinâmicas Compromisso com limites dos navegadores Javascript, CSS Bibliotecas de visualização D3 HTML5, canvas e SVG

Boas práticas em termos de quê? Engenharia de dados Extração de dados (entidades) Padronização Unificação de conceitos, terminologias e métricas Integração de dados Etc. Resolução de entidades Indicadores quantitativos de dados heterogêneos (p. ex: tweet vs post em blog)

Observatório da Web grande volume de dados

Observatório da Web Internet / Web Filas (queues) Extração e préprocessamento Enfileiramento Arquitetura Plataforma do Observatório da Web Mineração Pós- Process. Publicação Portal Web e API do Observatório Coleta MongoDb(dados brutos) Solr (indexação) Cassandra MySQL Cache Download de tweets, notícias, posts, feeds, etc. Extração de notícias, personalidades, referências. Organização e padronização dos dados (stemming, remoção de stopwords). Identificação de idioma. Expansão de URLs. Agrupamento de notícias, personalidades, fontes. Classificação de conteúdo. Análise de sentimento. Regras de associação. Mineração de padrões frequentes Processamento analítico (somatórios, contagens, médias, etc.) Geração de dados estáticos. Geração de screenshots. Geração de imagens de grafos. Publicação de conteúdo (web service, gadget, etc). Coleta de feedbacks de usuários. Registro de requisições.

Observatório da Web Estratégias para tempo real e grandes volumes de dados Pré-computar tudo que for necessário, à medida que a informação vai chegando: Dilui o esforço de processamento ao longo de muitos segundos Organizar a informação segundo os casos de uso: Algumas informações precisam de granularidade fina, a maioria, não. Uso de caches.

Observatório da Web Estratégias para tempo real e grandes volumes de dados Pré-computar tudo que for necessário, mesmo que demore. Uso de computação distribuída e algoritmos de Map- Reduce. - MapReduce do MongoDB não é suficiente. Uso adequado dos recursos: - I/O-bound: cluster - CPU-bound: cluster e/ou GPUs

Observatório da Web Twitter Storm Apache Zookeeper

Observatório da Web Tempo real e precisão (ou quando o bom é suficiente e o ótimo inalcançável)

Observatório da Web Em um fluxo (stream) de dados, não sabemos de antemão o volume nem a distribuição dos dados. Em vários cenários, não há capacidade computacional viável para processar o fluxo de dados e garantir precisão e tempo real.

Observatório da Web Linha de pesquisa de algoritmos que estudam fluxos de dados: O dado só pode ser lido uma vez do fluxo A memória é limitada Nem sempre a precisão é necessária. Em 1 minuto, a informação já pode estar desatualizada...

O observatório da Web

Observatório da Web Transformar, em tempo real, grandes volumes de dados em informações.

Observatório da Web

Observatório da Web

Observatório da Web

InWeb. Instituto Nacional de Tecnologia para a Web Observatório da Web 2.659.764 tweets em português sobre a dengue e 1.405.352 tweets em outras línguas: Em média, aprox. 3700 tweets por dia, mas este número varia ao longo do ano

Observatório da Web Termos mais mencionados sobre dengue Mensagens que citam mais de um conceito

Observatório da Web Exemplo: em 2011, houve surto de dengue em Manaus e Londrina. O exemplo mostra o total de tweets nas semanas.

Observatório da Web

Observatório da Web

Observatório da Web

Observatório da Web

Observatório da Web

Observatório da Web

Observatório da Web

Observatório da Web

Observatório da Web

Observatório da Web

Observatório da Web - Futuro Agregação de valor através de algoritmos robustos, eficientes, eficazes e inovadores; Plataforma escalável: Servidores e serviços escaláveis (virtualização, distribuição, replicação) Novos paradigmas e tecnologias Monitoramento de todos os processos e simplificação das tarefas de administração; Formalização de processos de manutenção dos serviços.

Futuro: perspectivas e tendências

Futuro: perspectivas e tendências Principais termos: Big data Cloud computing Dados abertos (open data) Linked data, Mashups Social data and networks O que mais?

Obrigado! www.inweb.org.br Adriano C. Machado Pereira e-mail: adrianoc@dcc.ufmg.br