A Cloud Computing Architecture for Large Scale Video Data Processing



Documentos relacionados
Dealing with Device Data Overflow in the Cloud

Rafael Jessen Werneck de Almeida Martins. Recomendação de pessoas em redes sociais com base em conexões entre usuários

Uma arquitetura baseada em agentes de software para a automação de processos de gerênciadefalhasemredesde telecomunicações

Ricardo Gomes Clemente. Uma arquitetura para processamento de eventos de log em tempo real. Dissertação de Mestrado

Um Modelo de Componentes de Software com Suporte a Múltiplas Versões

Uma Análise de Práticas na Aplicação de SCRUM em Projetos de Grande Porte

Sílvio Glicério Mendonça. O impacto dos Sistemas Integrados de Gestão (ERP) nas instituições de ensino. Dissertação de Mestrado (Opção profissional)

Luiz Fernando Fernandes de Albuquerque. Avaliação de algoritmos online para seleção de links patrocinados. Dissertação de Mestrado

Tese / Thesis Work Análise de desempenho de sistemas distribuídos de grande porte na plataforma Java

Rafael Barbosa Nasser. McCloud Service Framework. Arcabouço para desenvolvimento de serviços baseados na Simulação de Monte Carlo na Cloud

Fábio Markus Nunes Miranda. Volume rendering of unstructured hexahedral meshes DISSERTAÇÃO DE MESTRADO

UMA ABORDAGEM PARA GESTÃO DE CONTEÚDOS EDUCACIONAIS

Um Processo Controlável de Desenvolvimento de Software Focado na Gestão da Qualidade em Pequenos Projetos

Uma arquitetura de software para mediação flexível de Web services

Silvano Nogueira Buback. Utilizando aprendizado de máquina para construção de uma ferramenta de apoio a moderação de comentários

Livia Pires Chaves. Gestão de Estoque na Indústria de Manutenção de Motores Aeronáuticos: Estudo de Caso. Dissertação de Mestrado

Marcelo Novaes Coutinho. Um Processo de Gerência de Estratégia de Rastreabilidade: Um Caso em Ambiente Oracle. Dissertação de Mestrado

Elbio Renato Torres Abib. Escalonamento de Tarefas Divisíveis em Redes Estrela MESTRADO. Informática DEPARTAMENTO DE INFORMÁTICA

Distribuição Eletrônica na Hotelaria: Desenvolvimento de Serviços para a Internet

Relato de experiência da implantação de boas práticas de Engenharia de Software em um ambiente heterogêneo

Leonardo Pereira Rodrigues dos Santos

Geração automática de suíte de teste para GUI a partir de Rede de Petri

Wilson Reis de Souza Neto. O Teorema de Paris-Harrington. Dissertação de Mestrado

Controle de estoque de peças de reposição: revisão da literatura e um estudo de caso

Planejamento do sequenciamento de caminhões em um ambiente de produção sob encomenda

Credit Default Swap: Exemplos de Apreçamento

Modelo de Controle de Acesso no Projeto de Aplicações na Web Semântica

Pierre Alexandre Charles Burban. Apreçamento de opções exóticas: Uma abordagem pela simulação de Monte-Carlo. Dissertação de Mestrado

Análise de Sistemas de Planejamento Avançado (APS): conceituação e avaliação

" Controle de Estoque com a Utilização do Sistema Kanban"

Luciana da Silva Almendra Gomes. Proveniência para Workflows de Bioinformática

Luiz Marques Afonso. Um Estudo Sobre Contratos em Sistemas de Componentes de Software. Dissertação de Mestrado

Saulo de Souza Ladeira. Técnica, território e ensino a distância: Articulações histórico-teóricas. Dissertação de Mestrado

Empresas de Gestão Conservadora: Potencial da Previsão de Demanda e Simulação Computacional

Análise da Governança Corporativa como Determinante das Despesas de Auditoria e Consultoria no Brasil

Infraestrutura, Gestão Escolar e Desempenho em Leitura e Matemática: um estudo a partir do Projeto Geres

Análise de Persistência de Participantes em Planos de Previdência

Componentes de um sistema computacional para análise de sistemas logísticos

Logística Lean: Conceituação e aplicação em uma empresa de cosmético.

Análise da Eficiência de Empresas de Comércio Eletrônico usando Técnicas da Análise Envoltória de Dados

Proposta de Modelo de Desenvolvimento de Sistema de Medição de Desempenho Logístico

Análise Temporal dos Preços da Commodity Cobre Usando o Modelo Box & Jenkins

Empresas com Fundos de Private Equity Possuem Maior Valor e Remuneram Melhor Seus Executivos? Evidencia do Mercado Brasileiro

Processo de Internacionalização na Indústria Calçadista Brasileira: Estudo de Caso da Calçados Azaléia S.A.

José Benedito Alves Junior

A Dinâmica em um Projeto de Tecnologia de Grande Porte

Indicadores de Pesquisa, Desenvolvimento e Inovação (P,D&I) em Software e Serviços de TI: o Caso da Lei do Bem (nº /05)

DISSERTAÇÃO DE MESTRADO

A CONVERSÃO ADJETIVO/SUBSTANTIVO EM FORMAÇÕES DEVERBAIS X-DO NO PORTUGUÊS DO BRASIL

Adoção do Serviço de Mensagens de Texto (SMS) pelos usuários de telefonia móvel: Uma proposta baseada no Modelo de Aceitação da Tecnologia

Gestão tributária da cadeia de suprimentos - Problema de localização de empresa do setor de varejo eletrônico brasileiro

Gerenciamento de Risco em Empresas Não Financeiras: Aplicações na Indústria Sucroenergética

Heloisa Iara Colchete Provenzano. Personalidade e Risco: Um estudo em Finanças Comportamentais. Dissertação de Mestrado

OVERVIEW DO EAMS. Enterprise Architecture Management System 2.0

Maria Alice de Faria Nogueira. Consumo e publicidade: Apropriação localizada e mensagem global. Dissertação de Mestrado

Análise Probabilística de Semântica Latente aplicada a sistemas de recomendação

Dimensionamento de Estoque de Segurança de Derivados de Petróleo: Metodologia e um Estudo de Caso

Gestão Hospitalar O caso de hospitais privados do Rio de Janeiro

HadoopDB. Edson Ie Serviço Federal de Processamento de Dados - SERPRO

Helena Kale Pimentel Brazão. Orkut: do Escapismo ao Real Mediado, do Usuário ao Sujeito. Dissertação de Mestrado

Computação em Grid e em Nuvem

Estratégias de TI para a integração eletrônica da informação - um estudo sobre o estado da arte e da prática

Máquinas de Estados Hierárquicas em Jogos Eletrônicos

O transporte ferroviário de carga no Brasil: Estudo de caso do transporte de combustíveis na Região Sul

Gerenciamento Eletrônico de Documentos. Resumo. Palavras-chave. Summary. Word-key

Reflexão e fundamento: a validade universal do juízo de gosto na estética de Kant

Classificação de Imagens de Sensoriamento Remoto usando SVM

Interoperability through Web Services: Evaluating OGC Standards in Client Development for Spatial Data Infrastructures

Using Big Data to build decision support tools in

Computação de alto desempenho. Joubert de Castro Lima Professor Adjunto DECOM

Avaliação do Controle de Acesso de Múltiplos Usuários a Múltiplos Arquivos em um Ambiente Hadoop

NOVO MODELO PARA AUTORIZAÇÃO EM FEDERAÇÕES DE IDENTIDADE PARA COMPUTAÇÃO EM NUVEM


Integração do processo de compra estratégica com as ferramentas de compra eletrônica

Terceirização de Serviços de Tecnologia da Informação: Experiência Consultiva de Profissionais de TI

Danielle de Rezende Jorge. Frações contínuas: propriedades ergódicas e de. Dissertação de Mestrado

Comportamento do Consumidor em Relação à Educação a Distância: Abordagem Funcional das Atitudes Aplicada ao Marketing

Vinicius Ribeiro Pereira. Métodos Alternativos no Critério Brasil para Construção de Indicadores Sócio-Econômico: Teoria da Resposta ao Item

AN IN-DEPTH STUDY OF MAP REDUCE IN CLOUD ENVIRONMENT. Sistemas Distribuídos e Tolerância a Falhas Nuno Garcia m6284, Tiago Carvalho m6294

Gerador de aplicações para consultas a bases RDF/RDFS

Parallel Algorithms for Multicore Game Engines

Transcrição:

Marcello de Lima Azambuja A Cloud Computing Architecture for Large Scale Video Data Processing Dissertação de Mestrado Dissertation presented to the Postgraduate Program in Informatics of the Departamento de Informática do Centro Técnico da PUC-Rio, as partial fulfillment of the requirements for the degree of Mestre em Informática. Advisor: Prof. Karin Breitman Rio de Janeiro August 2011

Marcello de Lima Azambuja A Cloud Computing Architecture for Large Scale Video Data Processing Dissertation presented to the Postgraduate Program in Informatics of the Departamento de Informática do Centro Técnico da PUC-Rio, as partial fulfillment of the requirements for the degree of Mestre em Informática. Prof. Karin Breitman Advisor Departamento de Informática PUC-Rio Prof. José Viterbo Filho Universidade Federal Fluminense UFF Carolina Howard Felicíssimo Pesquisadora da Schlumberger Prof. José Eugênio Leal Coordenador Setorial do Centro Técnico Científico PUC-Rio Rio de Janeiro, August 31, 2011

All rights reserved Marcello de Lima Azambuja The author is graduated in Electronics and Computer Engineering from Universidade Federal do Rio de Janeiro UFRJ in 2005. Currently, Senior Product Manager at Globo.com. Azambuja, Marcello de Lima Bibliographic data A Cloud Computing Architecture For Large Scale Video Data Processing / Marcello de Lima Azambuja; advisor: Karin Breitman 2011. v., 62 f: il. ; 29,7 cm 1. Dissertação (Mestrado em Informática) Pontifícia Universidade Católica do Rio de Janeiro, Departamento de Informática, Rio de Janeiro, 2011. Inclui bibliografia. 1. 1. Informática Teses. 2. Arquitetura de software. 3. Computação na nuvem. 4. Armazenamento. 5. Sistemas distribuídos. 6. Conteúdo gerado pelo usuário. I. Breitman, Karin. II. Pontifícia Universidade Católica do Rio de Janeiro. Departamento de Informática. III. Título CDD: 004

Resumo Azambuja, Marcello de Lima; Breitman, Karin. Uma Arquitetura em Nuvem para Processamento de Vídeo em Larga Escala. Rio de Janeiro, 2011. 62p. Dissertação de Mestrado - Departamento de Informática, Pontifícia Universidade Católica do Rio de Janeiro. O advento da Internet coloca grandes desafios para o projeto de sistemas de submissão abertos, uma vez que elimina barreiras físicas e geográficas. A redução de custos, associada a passagem de mídias analógicas para digitais, dificultou a projeção de capacidades e recursos necessários para a construção de tais sistemas. Neste trabalho propomos uma arquitetura de software, baseada em computação na nuvem, que provê a escalabilidade necessária para a construção de sistemas de submissão abertos. Estes sistemas são caracterizados pela geração de grandes volumes de dados. Um caso real de uso é analisado utilizando o processamento de vídeos. Palavras-chave Arquitetura de software; computação na nuvem; armazenamento; sistemas distribuídos; conteúdo gerado pelo usuário.

Abstract Azambuja, Marcello de Lima; Breitman, Karin (Advisor). A Cloud Computing Architecture for Large Scale Video Data Processing. Rio de Janeiro, 2011. 62p. MSc. Dissertation - Departamento de Informática, Pontifícia Universidade Católica do Rio de Janeiro. The advent of the Internet poses great challenges to the design of public submission systems as it eliminates traditional barriers, such as geographical location and cost. With open global access, it is very hard to estimate storage space and processing power required by this class of applications. In this thesis we explore cloud computing technology as an alternative solution. The main contribution of this work is a general architecture in which to built open access, data intensive, public submission systems. A real world scenario is analyzed using this architecture for video processing. Keywords Software architecture; cloud computing; storage; distributed systems; user generated content.

Contents 1 INTRODUCTION... 8 1.1 MOTIVATION... 8 1.2 GOALS... 9 1.3 THESIS ORGANIZATION... 9 2 BACKGROUND AND THE ONLINE VIDEO LANDSCAPE... 11 2.1 OVERVIEW... 11 2.2 SEA CHANGE... 11 2.3 RAMPING UP... 12 2.4 SPLIT AND MERGE... 13 2.5 DISTRIBUTION CHALLENGES... 14 2.6 CONSUMER CHALLENGES... 15 3 AN ARCHITECTURE FOR PUBLIC AND OPEN SUBMISSION SYSTEMS IN THE CLOUD... 17 3.1 PROBLEM ADDRESSED... 17 3.2 RESEARCH RELEVANCE... 17 3.3 UNIQUENESS OF DESIGN AND IMPLEMENTATION... 18 3.4 UNDERLYING IMPLEMENTATION TECHNIQUES AND USED TECHNOLOGIES... 21 3.5 DESCRIPTION OF PRESENTATION... 22 4 CASE STUDY THE BIG BROTHER REALITY SHOW... 26 4.1 INTRODUCTION... 26 4.2 CLOUD COMPUTING... 27 4.3 PROPOSED ARCHITECTURE... 28 4.4 CASE STUDY... 31 4.5 USER GENERATED CONTENT ARCHITECTURE... 32 4.6 CONCLUSION... 35 5 AN ARCHITECTURE FOR DISTRIBUTED HIGH PERFORMANCE VIDEO PROCESSING IN THE CLOUD... 37 5.1 INTRODUCTION... 37 5.2 BACKGROUND AND PROBLEM STATEMENT... 38 5.3 DISTRIBUTED VIDEO... 40 5.4 THE SPLIT STEP... 42 5.5 THE PROCESS STEP... 44 5.6 THE MERGE STEP... 46 5.7 PERFORMANCE TESTS... 47 5.8 DISCUSSION... 50 5.9 FAULT TOLERANCE... 51 5.10 PRIVATE CLUSTER... 52 5.11 PUBLIC CLOUD DEPLOYMENT... 54 5.12 CONCLUSION... 55 6 CONCLUSIONS... 57 6.1 CONTRIBUTION... 57 6.2 FUTURE WORK... 57 7 REFERENCES... 59

List of Figures FIGURE 2.1. EVOLUTION OF MEDIA DISPLAY TYPES.... 12 FIGURE 2.2. SPLIT AND MERGE ARCHITECTURE.... 13 FIGURE 3.1. ARCHITECTURE FOR THE PUBLIC SUBMISSION SYSTEM.... 19 FIGURE 3.2. EXAMPLE OF INPUT MESSAGE USED BY THE APPLICATION.... 20 FIGURE 3.3. EXAMPLE OF OUTPUT MESSAGE USED BY THE APPLICATION.... 20 FIGURE 3.4. BIG BROTHER BRASIL S OFFICIAL WEB PAGE.... 22 FIGURE 3.5. SIGN-IN AND SIGN-UP WEB PAGE.... 23 FIGURE 3.6. CONTENT SUBMISSION FORM WEB PAGE.... 23 FIGURE 3.7. AMAZON AWS MANAGEMENT CONSOLE SCREEN.... 24 FIGURE 4.1. PROPOSED ARCHITECTURE FOR THE PUBLIC SUBMISSION SYSTEM.... 29 FIGURE 4.2. EXAMPLE OF INPUT MESSAGE USED BY THE APPLICATION.... 30 FIGURE 4.3. EXAMPLE OF OUTPUT MESSAGE USED BY THE APPLICATION.... 30 FIGURE 4.4. CONFIGURATION FILE FOR EC2 INSTANCE.... 31 FIGURE 4.5. WEB SITE FOR THE BIG BROTHER REALITY SHOW.... 33 FIGURE 4.6. META-DATA INFORMATION FOR THE UGC.... 34 FIGURE 4.7. USER GENERATED CONTENT ARCHITECTURE.... 34 FIGURE 5.1. MAP REDUCE ARCHITECTURE.... 38 FIGURE 5.2. ENCODING SPEED FOR DIFFERENT H.264 IMPLEMENTATIONS... 41 FIGURE 5.3. THE PROPOSED SPLIT&MERGE ARCHITECTURE... 42 FIGURE 5.4. TOTAL ENCODING TIMES FOR DIFFERENT SEQUENCE DURATIONS (S).... 48 FIGURE 5.5. PRIVATE CLUSTER SPLIT&MERGE ARCHITECTURE.... 53 FIGURE 5.6. PUBLIC CLOUD SPLIT&MERGE ARCHITECTURE... 55!