Contexto. Algoritmos para conjuntos massivos de dados. Aplicação. Modelo de Data Stream 20/10/2016

Tamanho: px
Começar a partir da página:

Download "Contexto. Algoritmos para conjuntos massivos de dados. Aplicação. Modelo de Data Stream 20/10/2016"

Transcrição

1 Contexto Algoritmos para conjuntos massivos de dados Eduardo Laber Algumas sequências são grandes demais para ser armazenadas na memória e/ou o tempo de processamento disponível é limitado. Dados oriundos de tráfico de rede Dados de rede de sensores Dados de satélites Transações de bancos de dados Modelo de Data Stream Data stream: A=(a(1),,a(n)) ( n grande) a(i) pertence a um alfabeto de m símbolos possíveis Por conveniência o alfabeto é {1,...,m} Somente uma passada nos dados Memória limitada (sublinear) Tempo de processamento por character limitado Aplicação Manter estatísticas de pacotes que chegam a um roteador. De onde vem e para onde vão? Se cada pacote tem 32 bits deveriamos manter uma matriz de 2 32 x2 32 1

2 Estimando frequências em stream de dados Data stream: A=(a(1),,a(n)) ( n grande) a(i) pertence a um alfabeto de m símbolos possíveis Por conveniência o alfabeto é {1,...,m} f(s): frequência do símbolo s no data stream Estimando frequências em stream de dados Aplicações: Para um inteiro não negativo p, o p-ésimo momento da frequência da stream A m i=1 f(i)p p=0 número total de símbolos distintos p=1 total de símbolos p=2 noção da variância da stream Estimando frequências em stream de dados Aplicações número de símbolos distintos número de IP s distintos que acessam um site Itens mais frequentes IP s mais frequentes Notação m: tamanho do conjunto universo n: tamanho da stream Abordagem força bruta Mantem um registro para cada um dos m valores possíveis: Espaço O(m) e tempo O(1) 2

3 Limite inferior Assuma n=m+1 O número de subconjuntos possíveis para os m primeiros símbolos é 2 m Cada um destes subconjunto tem que ser representado de forma diferente, caso contrário existiriam duas instâcias distintas I_1 e I_2 correspondendo a conjuntos diferentes S_1 e S_2 que teriam a mesma representação na memória após a leitura dos n primeiros símblos da stream Limite inferior Se S_1 = S_2 seja a(m+1) um elemento que está em S_1 mas não está em S_2. O algoritmo erra para alguma das instâncias Se S_1 > S_2 seja a(m+1) um elemento que está em S_1 mas não está em S_2. O algoritmo erra para alguma das instâncias Se S_2 > S_1 seja a(m+1) um elemento que está em S_2 mas não está em S_2. O algoritmo erra para alguma das instâncias S: conjunto de itens distintos da data stream e seja S =d Assuma que S foi sorteado aleatoriamente de {1,...,m} min: menor elemento sorteado Com alta probabilidade min está entre 0.2m/d e 2m/d Portanto, m/ min é uma boa estimativa para d= S min pode ser mantido em O(1) Pr[min 0.2m /d ] é aproximadamente 1- [ (m- 0.2m/d) / m ] d que tende para 1- (1/e) Pr[min >= 2m / d ] é aproximadamente [ (m-2m/d) / m ] d que tende para (1-2/d) d <= Pr[0.2m /d <= min <= 2m / d ] é aproximadamente é

4 Problema... A abordagem assume que S é sorteado aleatoriamente do conjunto {1,...,m} Se S consistir dos S primeiros elementos de {1,...,m} a técnica não funciona A estimativa é m em vez de S Abordagem por hashing M: número inteiro T.B.D h: {1,...,m} {0,1,...,M-1} é uma função de hashing Para contar o número de elementos distintos do data stream, podemos contar o número de elementos distintos de h(a(1)),...,h(a(n)) A função de hashing deve espalhar bem os símbolos de modo que h(a(1)),...,h(a(n)) funcione como uma amostra aleatória de {0,...,M-1} Definição: Um conjunto de funções de hashing H={h h:{1,...,m} {0,1...,M-1} } é 2-universal se e somente se para todo x<> y {1,...m} e para todo z,w {0,1,2,...,M} temos que Pr[h(x)=z e h(y)=w] = 1/M 2 Proposição: Se H é uma família 2- universal então para todo x {1,...m} e w {0,1,2,...,M} temos que Prova. Pr[h(x)=w]= Pr[h(x)=w] = 1/M z Pr[h(x)=w e h(y)=z] =M(1/M 2 ) A probabilidade é sobre o sorteio de h no conjunto H 4

5 Exemplo: Seja M um primo. Seja h ab (x)=ax+b mod M Então é possível provar que é 2-universal H= {h ab a,b {0,1...,M-1} } Algoritmo. 1. Sorteie uma função de hash h do conjunto H (sorteio uniforme) 2. Mantenha o mínimo min de h(a(1)),...,h(a(n)) 3. Devolva M/min como estimativa do número de elementos distintos da stream de dados Lema (Hop 7.1) Seja M>100d. Com prob 2/3 d/6 M/min 6d Prova: Basta provar: a) Pr [M/min 6d ] <= 1/6 b) Pr [M/min d/6 ] <= 1/6 Prova (a) b 1,,b d : itens distintos do data stream A probabilidade de M/min 6d é igual a probabilidade de escolher uma função h tal que existe b k com h(b k ) M/6d 5

6 Prova: Defina Variável Aleatória z i com z i =1 se h(b i ) M/6d e z i =0, caso contrário Pr[z i =1]=1/6d, para todo i Se o procedimento retorna valor maior que 6d então z 1 + +z d 1 Prova: E[z 1 + +z d ]=Pr[z 1 =1]+ +Pr[z d =1]=1/6 Pela desigualdade de Markov: Pr [z 1 + +z d 1] E[z 1 + +z d ]=1/6 Prova: b) Com prob 1/6 temos M/min d/6 Defina V.A z i com y i =0 se h( b i )>6M/d y i =1, c..c Se M/min d/6 então todas V.A y i tem valor 0 Temos Pr[y i =1]>6/d Seja y=y 1 + +y d E[y]=Pr[y 1 =1]+ +Pr[y d =1]>6 Como a familia de hash é 2-universal temos que Var(y)=Var(y 1 )+ +Var(y d )=dvar(y 1 ) 6

7 Temos que Var(y i )= E[y i 2 ] - E 2 [y i ] = E[y i ] - E 2 [y i ] <E[y i ] Portanto, Var(y)<E[y] Para melhorar a probabilidade e o intervalo podemos trabalhar em paralelo com vários funções independentes e ficar com a mediana delas Logo, utilizando Chebyshev Prob [ M/min < d/6] = Prob[y=0] < Prob[ y- E(y) E[y] ] Var(y)/E 2 (y) 1/E[y] 1/6 Problema: como contar o item mais frequente em um data stream? Caso particular: como determinar se algum item ocorre mais que n/2 vezes? Caso particular: como determinar se algum item ocorre mais que n/2 vezes? Lower Bound Memória: Modelo Cada item só pode ser lido uma vez Considere entrada em que os n/2 primeiros elementos são diferentes e os n/2 últimos são iguais. 7

8 Lower Bound Memória: Sejam A e B conjuntos distintos de n/2 elementos. Portanto, a configuração da memória associada a leitura do conjunto A tem que ser diferente da associada a leitura do conjunto B, caso contrário o algoritmo daria a mesma resposta nos dois casos Como existem C(m,n/2) conjuntos possíveis com n/2 elementos a memória tem que ter tamanho maior ou igual a log (C(m,n/2)) bits Se m>n então precisamos de memória n Algorithm Frequent Mantenha uma lista com k posições dos itens que estamos contando A lista é inicialmente vazia Para i=1,...,n faça Se a(i) está na posição j da lista cont(j) cont(j)+1 Se a(i) não está na lista Se a lista não está cheia inclua a(i) e faça o contador dele ser 1 Se a lista está cheia faça o contador dele ser 0; decremente todos os contadores da lista de 1 e retire da lista os itens com contador 0 Teorema (Hopcroft 7.2). Ao término do algoritmo para cada s em {1,...,m}, o contador de s é f(s)- n/(k+1). Corolário. Se um item não aparece na lista no final então sua frequência no data stream é n/(k+1) Complexidade de Espaço: proporcional a k log n bits. Aplicação: encontrar os itens mais frequentes, que ocorrem pelo menos n/(k+1) vezes para um dado k. Teorema. Ao término do algoritmo para cada s em {1,...,m}, o contador de s é maior ou igual ao número de ocorrências de s menos n/(k+1) Prova Podemos assumir que sempre que um item é acessado seu contador é incrementado e sempre que ele não consegue entrar na lista seu contador é decrementado Itens fora da lista tem contador igual a 0 8

9 Teorema. Ao término do algoritmo para cada s em {1,...,m}, o contador de s é ao número de ocorrências de s menos n/(k+1) Prova Seja s um item na lista ao término do algoritmo. Sempre que o contador de s é decrementado, o contador de outros k itens são decrementados. Portanto, o contador de s só pode ser decrementado no máximo n/(k+1) vezes, caso a soma total dos decrementos seria maior que n mas esta soma é limitada pelo total de incrementos que é n. 9

Aula 7. Aula de hoje. Aula passada

Aula 7. Aula de hoje. Aula passada Aula 7 Aula passada Método de Monte Carlo Estimando somatórios Calculando erro Estimando Erro de Integração de Monte Carlo Monte Carlo Ray Tracing Aula de hoje Gerando amostras de v.a. discretas Gerando

Leia mais

Algoritmos Probabilísticos

Algoritmos Probabilísticos Algoritmos Probabilísticos Gilson Evandro Fortunato Dias Orientador: José Coelho de Pina Universidade de São Paulo Instituto de Matemática e Estatística Departamento de Ciência da Computação MAC0499 p.

Leia mais

Modelagem e Análise de Sistemas de Computação Aula 19

Modelagem e Análise de Sistemas de Computação Aula 19 Modelagem e Análise de Sistemas de Computação Aula 19 Aula passada Intro a simulação Gerando números pseudo-aleatórios Aula de hoje Lei dos grandes números Calculando integrais Gerando outras distribuições

Leia mais

TÉCNICAS DE CODIFICAÇÃO DE SINAIS

TÉCNICAS DE CODIFICAÇÃO DE SINAIS TÉCNICAS DE CODIFICAÇÃO DE SINAIS COMPRESSÃO SEM PERDAS Evelio M. G. Fernández - 2010 Exemplo Símbolo Prob I II III IV A 1/2 00 0 0 0 B 1/4 01 11 10 01 C 1/8 10 00 110 011 D 1/8 11 01 1110 0111 Entropia

Leia mais

Dados no R n. Dados em altas dimensões 29/03/2017

Dados no R n. Dados em altas dimensões 29/03/2017 Dados no R n Dados em altas dimensões Alguns dados são apresentados como vetores em R n Alguns dados não são apresentados como vetores mas podem ser representados como vetores (e.g. Texto) Texto Dados

Leia mais

Variáveis Aleatórias Bidimensionais &Teoremas de Limite 1/22

Variáveis Aleatórias Bidimensionais &Teoremas de Limite 1/22 all Variáveis Aleatórias Bidimensionais & Teoremas de Limite Professores Eduardo Zambon e Magnos Martinello UFES Universidade Federal do Espírito Santo DI Departamento de Informática CEUNES Centro Universitário

Leia mais

ME-310 Probabilidade II Lista 2

ME-310 Probabilidade II Lista 2 ME-3 Probabilidade II Lista 2. Uma máquina funciona enquanto pelo menos 3 das 5 turbinas funcionam. Se cada turbina funciona um tempo aleatório com densidade xe x, x >, independentemente das outras, calcule

Leia mais

3 Plano de Execução de Consultas

3 Plano de Execução de Consultas Sumário 1 Introdução ao Processamento de Consultas 2 Otimização de Consultas 3 Plano de Execução de Consultas 4 Introdução a Transações 5 Recuperação de Falhas 6 Controle de Concorrência 7 Fundamentos

Leia mais

Teoria das Filas aplicadas a Sistemas Computacionais. Aula 08

Teoria das Filas aplicadas a Sistemas Computacionais. Aula 08 Teoria das Filas aplicadas a Sistemas Computacionais Aula 08 Universidade Federal do Espírito Santo - Departamento de Informática - DI Laboratório de Pesquisas em Redes Multimidia - LPRM Teoria das Filas

Leia mais

Teoria das Filas aplicadas a Sistemas Computacionais. Aula 09

Teoria das Filas aplicadas a Sistemas Computacionais. Aula 09 Teoria das Filas aplicadas a Sistemas Computacionais Aula 09 Universidade Federal do Espírito Santo - Departamento de Informática - DI Laboratório de Pesquisas em Redes Multimidia - LPRM Teoria das Filas

Leia mais

Os números inteiros. Álgebra (Curso de CC) Ano lectivo 2005/ / 51

Os números inteiros. Álgebra (Curso de CC) Ano lectivo 2005/ / 51 Os números inteiros Abordaremos algumas propriedades dos números inteiros, sendo de destacar o Algoritmo da Divisão e o Teorema Fundamental da Aritmética. Falaremos de algumas aplicações como sejam a detecção

Leia mais

Hashing: conceitos. Hashing

Hashing: conceitos. Hashing Hashing: conceitos hashing é uma técnica conhecida como espalhamento, mapeamento ou randomização que tenta distribuir dados em posições aleatórias de uma tabela (array) associa cada objeto (de um determinado

Leia mais

Introdução à Ciência da Computação II

Introdução à Ciência da Computação II Introdução à Ciência da Computação II 2semestre/200 Prof Alneu de Andrade Lopes Apresentação com material gentilmente cedido pelas profas Renata Pontin Mattos Fortes http://wwwicmcuspbr/~renata e Graça

Leia mais

Algoritmos e Estrutura de Dados. Aula 11 Estrutura de Dados: Tabelas Hash Parte II Prof. Tiago A. E. Ferreira

Algoritmos e Estrutura de Dados. Aula 11 Estrutura de Dados: Tabelas Hash Parte II Prof. Tiago A. E. Ferreira Algoritmos e Estrutura de Dados Aula 11 Estrutura de Dados: Tabelas Hash Parte II Prof. Tiago A. E. Ferreira Introdução Como visto na aula passada as tabelas hash: Diminuem a quantidade de endereçamento

Leia mais

Sumário. Definição do Plano de Execução

Sumário. Definição do Plano de Execução Sumário 1 Introdução ao Processamento de Consultas 2 Otimização de Consultas 3 Plano de Execução de Consultas Introdução a Transações 5 Recuperação de Falhas 6 Controle de Concorrência 7 Fundamentos de

Leia mais

Hashing. Cormen Capítulo 11

Hashing. Cormen Capítulo 11 Hashing Cormen Capítulo 11 Motivação Um compilador utiliza uma tabela de símbolos para relacionar símbolos aos dados associados. Símbolos: nomes de variáveis, funções, etc.. Dados associados: localização

Leia mais

Matemática Discreta 12

Matemática Discreta 12 Universidade Federal do Vale do São Francisco Curso de Engenharia da Computação Matemática Discreta 12 Prof. Jorge Cavalcanti jorge.cavalcanti@univasf.edu.br - www.univasf.edu.br/~jorge.cavalcanti 1 Introdução

Leia mais

Avaliação e Desempenho Aula 5

Avaliação e Desempenho Aula 5 Avaliação e Desempenho Aula 5 Aula passada Revisão de probabilidade Eventos e probabilidade Independência Prob. condicional Aula de hoje Variáveis aleatórias discretas e contínuas PMF, CDF e função densidade

Leia mais

Probabilidade 2 - ME310 - Lista 2

Probabilidade 2 - ME310 - Lista 2 Probabilidade - ME3 - Lista September 4, Lembrando:. Estatística de ordem, pg 38 Ross: f xj (x) = n! (n j)!(j )! F (x)j ( F (x)) n j f(x). Distribuição de probabilidade conjunta de funções de variáveis

Leia mais

Tabela Hash. Disciplina de Algoritmos e Estrutura de Dados III. Prof. Marcos Antonio Schreiner 15/05/2015

Tabela Hash. Disciplina de Algoritmos e Estrutura de Dados III. Prof. Marcos Antonio Schreiner 15/05/2015 Tabela Hash Disciplina de Algoritmos e Estrutura de Dados III Prof. Marcos Antonio Schreiner 15/05/2015 Introdução Seja um conjunto de chaves armazenadas em um vetor e em uma árvore AVL. Qual a complexidade

Leia mais

Hashing Externo. SCC-503 Algoritmos e Estruturas de Dados II. Thiago A. S. Pardo M.C.F. de Oliveira Cristina Ciferri

Hashing Externo. SCC-503 Algoritmos e Estruturas de Dados II. Thiago A. S. Pardo M.C.F. de Oliveira Cristina Ciferri Hashing Externo SCC-503 Algoritmos e Estruturas de Dados II Thiago A. S. Pardo M.C.F. de Oliveira Cristina Ciferri 1 Hashing 0 1 chave de busca K = LOWELL 2 h(k) endereço 4 (RRN 4) 3 4 5... LOWELL......

Leia mais

Probabilidade II. Departamento de Estatística. Universidade Federal da Paraíba. Prof. Tarciana Liberal (UFPB) Aula Desigualdades 02/14 1 / 31

Probabilidade II. Departamento de Estatística. Universidade Federal da Paraíba. Prof. Tarciana Liberal (UFPB) Aula Desigualdades 02/14 1 / 31 Probabilidade II Departamento de Estatística Universidade Federal da Paraíba Prof. Tarciana Liberal (UFPB) Aula Desigualdades 02/14 1 / 31 Um teorema de grande importância e bastante utilidade em probabilidade

Leia mais

Teoria do aprendizado

Teoria do aprendizado Teoria do aprendizado Marcelo K. Albertini 7 de Agosto de 2014 2/37 Teoria do aprendizado Teoremas não existe almoço grátis Viés e variância Aprendizado PAC Dimensão VC Máquinas de vetores suporte 3/37

Leia mais

HASHING HASHING 6/10/2008

HASHING HASHING 6/10/2008 Hashing é uma técnica que busca realizar as operações de inserção, remoção e busca em tempo constante. Motivação - Acesso Direto: Suponha que existam n chaves a serem armazenadas em uma tabela T, seqüencial

Leia mais

COMUNICAÇÃO DIGITAL INTRODUÇÃO À TEORIA DE INFORMAÇÃO

COMUNICAÇÃO DIGITAL INTRODUÇÃO À TEORIA DE INFORMAÇÃO COMUNICAÇÃO DIGITAL INTRODUÇÃO À TEORIA DE INFORMAÇÃO Evelio M. G. Fernández - 2011 Introdução à Teoria de Informação Em 1948, Claude Shannon publicou o trabalho A A Mathematical Theory of Communications.

Leia mais

Probabilidade IV. Ulisses U. dos Anjos. Departamento de Estatística Universidade Federal da Paraíba. Período

Probabilidade IV. Ulisses U. dos Anjos. Departamento de Estatística Universidade Federal da Paraíba. Período Probabilidade IV Ulisses U. dos Anjos Departamento de Estatística Universidade Federal da Paraíba Período 2014.2 Ulisses Umbelino (DE-UFPB) Probabilidade IV Período 2014.2 1 / 20 Sumário 1 Apresentação

Leia mais

Hashing. Prof. Josenildo Silva IFMA 2014

Hashing. Prof. Josenildo Silva IFMA 2014 Hashing Prof. Josenildo Silva jcsilva@ifma.edu.br IFMA 2014 Esta versão é de 2014.11.08 2012-2014, Prof. Josenildo Silva. (jcsilva@ifma.edu.br) Estas notas de aula foram preparadas por Josenildo Silva

Leia mais

CIC 111 Análise e Projeto de Algoritmos II

CIC 111 Análise e Projeto de Algoritmos II CIC 111 Análise e Projeto de Algoritmos II Prof. Roberto Affonso da Costa Junior Universidade Federal de Itajubá AULA 27 Square root algorithms Combining algorithms Integer partitions Mo s algorithm Square

Leia mais

Aula 14. Aula de hoje. Aula passada

Aula 14. Aula de hoje. Aula passada Aula 14 Aula passada Autovalores, autovetores, decomposição Convergência para estacionaridade Tempo de mistura Spectral gap Tempo de mistura de passeios aleatórios Aula de hoje Caminho amostral Teorema

Leia mais

Canais discretos sem memória e capacidade do canal

Canais discretos sem memória e capacidade do canal Canais discretos sem memória e capacidade do canal Luis Henrique Assumpção Lolis 17 de outubro de 2013 Luis Henrique Assumpção Lolis Canais discretos sem memória e capacidade do canal 1 Conteúdo 1 Canais

Leia mais

ACH2024. Aula 22 Hashing Externo - Hashing estático e dinâmico (extensível) Prof Helton Hideraldo Bíscaro

ACH2024. Aula 22 Hashing Externo - Hashing estático e dinâmico (extensível) Prof Helton Hideraldo Bíscaro ACH04 Aula Hashing Externo - Hashing estático e dinâmico (extensível) Prof Helton Hideraldo Bíscaro 1 Tipos de organização de arquivos Sequencial Lista ligada (com ou sem tabela de alocação) Indexada Um

Leia mais

Introdução à Teoria de Grupos Grupos cíclicos Grupos de permutações Isomorfismos Teorema de Lagrange Subgrupos normais e grupos quociente

Introdução à Teoria de Grupos Grupos cíclicos Grupos de permutações Isomorfismos Teorema de Lagrange Subgrupos normais e grupos quociente Classes laterais Sejam G um grupo, H um subconjunto de G e a um elemento de G. Usamos as seguintes notações: ah = {ah h H} e Ha = {ha h H}. Definição (Classe lateral de H em G) Seja H um subgrupo do grupo

Leia mais

CAPÍTULO 5: VARIÁVEIS ALEATÓRIAS BIDIMENSIONAIS Todas as coisas aparecem e desaparecem por causa da concorrência de causas e condições. Nada nunca existe inteiramente só, tudo está em relação com todo

Leia mais

Amostragem e Distribuição Amostral. Tipos de amostragem, distribuição amostral de média, proporção e variância

Amostragem e Distribuição Amostral. Tipos de amostragem, distribuição amostral de média, proporção e variância Amostragem e Distribuição Amostral Tipos de amostragem, distribuição amostral de média, proporção e variância 1 AMOSTRAGEM Amostragem Probabilística ou Aleatória Amostragem Não Probabilística Amostragem

Leia mais

Lista 1. 8 de abril de Algorithms: Capítulo 0, exercícios 1 e 2. Tardos: Todos exercícios do cap 2 do livro texto, exceto 7 e 8 letra b.

Lista 1. 8 de abril de Algorithms: Capítulo 0, exercícios 1 e 2. Tardos: Todos exercícios do cap 2 do livro texto, exceto 7 e 8 letra b. Lista 1 8 de abril de 2013 1 Exercícios Básicos 1.1 Na bibliografia Algorithms: Capítulo 0, exercícios 1 e 2. Tardos: Todos exercícios do cap 2 do livro texto, exceto 7 e 8 letra b. 1.2 Outros 1. Projete

Leia mais

Tabelas Hash. informação, a partir do conhecimento de sua chave. Hashing é uma maneira de organizar dados que:

Tabelas Hash. informação, a partir do conhecimento de sua chave. Hashing é uma maneira de organizar dados que: Tabelas Hash Tabelas Hash O uso de listas ou árvores para organizar informações é interessante e produz bons resultados. Porem, em nenhuma dessas estruturas se obtém o acesso direto a alguma informação,

Leia mais

Redes Complexas Aula 7

Redes Complexas Aula 7 Redes Complexas Aula 7 Aula retrasada Lei de potência Distribuição Zeta Propriedades Distribuição Zipf Exemplo Wikipedia Aula de hoje Distribuição de Pareto Medindo lei de potência Estimando expoente Exemplos

Leia mais

Geradores e relações

Geradores e relações Geradores e relações Recordamos a tabela de Cayley de D 4 (simetrias do quadrado): ρ 0 ρ 90 ρ 180 ρ 270 h v d 1 d 2 ρ 0 ρ 0 ρ 90 ρ 180 ρ 270 h v d 1 d 2 ρ 90 ρ 90 ρ 180 ρ 270 ρ 0 d 2 d 1 h v ρ 180 ρ 180

Leia mais

Modelagem e Análise de Sistemas de Computação Aula 20

Modelagem e Análise de Sistemas de Computação Aula 20 Modelagem e Análise de Sistemas de Computação Aula 20 Aula passada Lei dos grandes números Calculando integrais Gerando outras distribuições Método da transformada inversa Aula de hoje Simulando uma fila

Leia mais

Estatística 4 - Variáveis Aleatórias Unidimensionais

Estatística 4 - Variáveis Aleatórias Unidimensionais Estatística 4 - Variáveis Aleatórias Unidimensionais UNESP FEG DPD Prof. Edgard - 11 4-1 VARIÁVEIS ALEATÓRIAS UNIDIMENSIONAIS Variável Aleatória X é uma Função que associa um número real a cada Evento

Leia mais

AULA 24. Algoritmos p.856/905

AULA 24. Algoritmos p.856/905 AULA 24 Algoritmos p.856/905 Máximo divisor comum CLRS 31.1 e 31.2 Algoritmos p.857/905 Divisibilidade Suponha que a, b e d são números inteiros. Dizemos que d divide a se a = k d para algum número inteiro

Leia mais

4. Distribuições de probabilidade e

4. Distribuições de probabilidade e 4. Distribuições de probabilidade e características Valor esperado de uma variável aleatória. Definição 4.1: Dada uma v.a. discreta (contínua) X com f.m.p. (f.d.p.) f X (), o valor esperado (ou valor médio

Leia mais

13 Hashing (parte 2) SCC201/501 - Introdução à Ciência de Computação II

13 Hashing (parte 2) SCC201/501 - Introdução à Ciência de Computação II 13 Hashing (parte 2) SCC201/501 - Introdução à Ciência de Computação II Prof. Moacir Ponti Jr. www.icmc.usp.br/~moacir Instituto de Ciências Matemáticas e de Computação USP 2010/2 Moacir Ponti Jr. (ICMCUSP)

Leia mais

CC-226 Introdução à Análise de Padrões

CC-226 Introdução à Análise de Padrões CC-226 Introdução à Análise de Padrões Probabilidades e Estatísticas Descritivas Carlos Henrique Q. Forster 1 1 Divisão de Ciência da Computação Instituto Tecnológico de Aeronáutica 3 de março de 2008

Leia mais

Codificação de Huffman

Codificação de Huffman Codificação de Huffman Bruna Gregory Palm 11 de setembro de 2017 A codificação de Huffman é um método de compressão que considera as probabilidades de ocorrência de cada símbolo no conjunto de dados a

Leia mais

Teoria da Informação

Teoria da Informação Charles Casimiro Cavalcante charles@gtel.ufc.br Grupo de Pesquisa em Telecomunicações Sem Fio GTEL Programa de Pós-Graduação em Engenharia de Teleinformática Universidade Federal do Ceará UFC http://www.gtel.ufc.br/

Leia mais

MC3305 Algoritmos e Estruturas de Dados II. Aula 02 Hashing. Prof. Jesús P. Mena-Chalco.

MC3305 Algoritmos e Estruturas de Dados II. Aula 02 Hashing. Prof. Jesús P. Mena-Chalco. MC3305 Algoritmos e Estruturas de Dados II Aula 02 Hashing Prof. Jesús P. Mena-Chalco jesus.mena@ufabc.edu.br 2Q-2015 1 Sobre a busca de dados/chaves 2 Busca em tabelas (vetores/arrays) Para se resolver

Leia mais

Análise amortizada CLRS 17. Algoritmos p. 1

Análise amortizada CLRS 17. Algoritmos p. 1 Análise amortizada CLRS 17 Algoritmos p. 1 Análise amortizada Serve para analisar uma sequência de operações ou iterações onde o pior caso individual não reflete o pior caso da sequência. Em outras palavras,

Leia mais

a) o time ganhe 25 jogos ou mais; b) o time ganhe mais jogos contra times da classe A do que da classe B.

a) o time ganhe 25 jogos ou mais; b) o time ganhe mais jogos contra times da classe A do que da classe B. Universidade de Brasília Departamento de Estatística 5 a Lista de PE. Um time de basquete irá jogar uma temporada de 44 jogos. desses jogos serão disputados contra times da classe A e os 8 restantes contra

Leia mais

Prof. Eduardo Bezerra. 15 de setembro de 2017

Prof. Eduardo Bezerra. 15 de setembro de 2017 Distribuições Amostrais Prof. Eduardo Bezerra Inferência Estatística 15 de setembro de 2017 Eduardo Bezerra (CEFET/RJ) Distribuições Amostrais 1 / 28 Roteiro Distribuições amostrais 1 Distribuições amostrais

Leia mais

Aula 4. Aula de hoje. Aula passada

Aula 4. Aula de hoje. Aula passada Aula 4 Aula passada Função de distribuição Bernoulli Sequência de v.a. Binomial, Geométrica, Zeta Valor esperado Variância Distribuição conjunta Independência de v.a. Aula de hoje Valor esperado condicional

Leia mais

RESOLUÇÃO DCC-UFRJ MATEMÁTICA COMBINATÓRIA 2006/2 PROVA Considere a soma. S n = n 2 n 1

RESOLUÇÃO DCC-UFRJ MATEMÁTICA COMBINATÓRIA 2006/2 PROVA Considere a soma. S n = n 2 n 1 DCC-UFRJ MATEMÁTICA COMBINATÓRIA 2006/2 PROVA 1 1. Considere a soma S n = 1 2 0 + 2 2 1 + 3 2 2 + + n 2 n 1. Mostre, por indução finita, que S n = (n 1)2 n + 1. Indique claramente a base da indução, a

Leia mais

ALGORITMO DE EUCLIDES

ALGORITMO DE EUCLIDES Sumário ALGORITMO DE EUCLIDES Luciana Santos da Silva Martino lulismartino.wordpress.com lulismartino@gmail.com PROFMAT - Colégio Pedro II 25 de agosto de 2017 Sumário 1 Máximo Divisor Comum 2 Algoritmo

Leia mais

Fundamentos de Telecomunicações

Fundamentos de Telecomunicações Fundamentos de Telecomunicações LEEC_FT 4,5&6: Teoria da Informação Codificação de Fonte Professor Victor Barroso vab@isr.ist.utl.t Lição 4 Informação e Entroia Introdução Incerteza, robabilidade e informação

Leia mais

Ciclo 3 Encontro 2 PROBABILIDADE. Nível 3 PO: Márcio Reis 11º Programa de Iniciação Científica Jr.

Ciclo 3 Encontro 2 PROBABILIDADE. Nível 3 PO: Márcio Reis 11º Programa de Iniciação Científica Jr. 1 Ciclo 3 Encontro 2 PROBABILIDADE Nível 3 PO: Márcio Reis 11º Programa de Iniciação Científica Jr. Probabilidade 2 Texto: Módulo Introdução à Probabilidade O que é probabilidade? parte 1 de Fabrício Siqueira

Leia mais

5 a Lista de PE Solução

5 a Lista de PE Solução Universidade de Brasília Departamento de Estatística 5 a Lista de PE Solução. Sejam X A e X B o números de jogos que o time ganha contra times da classe A e da classe B respectivamente. Claramente X A

Leia mais

Probabilidade II. Departamento de Estatística. Universidade Federal da Paraíba

Probabilidade II. Departamento de Estatística. Universidade Federal da Paraíba Probabilidade II Departamento de Estatística Universidade Federal da Paraíba Prof. Tarciana Liberal (UFPB) Aula Lei dos Grandes Números e Teorema Central do Limite 02/14 1 / 9 Lei dos Grandes Números Lei

Leia mais

Estatística e Modelos Probabilísticos - COE241

Estatística e Modelos Probabilísticos - COE241 Estatística e Modelos Probabilísticos - COE241 Aula passada Algoritmo para simular uma fila Medidas de interesse Média amostral Aula de hoje Teorema do Limite Central Intervalo de Confiança Variância amostral

Leia mais

EET-49 Comunicações II

EET-49 Comunicações II EET-49 Comunicações II Parte 4 - Codificação sem perda de informação March 20, 2012 1 Introdução Realizar a codificação da fonte é representá-la da menor forma possível Se a utilização não permite a perda

Leia mais

ACH Introdução à Estatística Conteúdo Teórico: 12 - Simulação

ACH Introdução à Estatística Conteúdo Teórico: 12 - Simulação ACH2053 - Introdução à Estatística Conteúdo Teórico: Marcelo S. Lauretto Referências: Morris DeGroot, Mark Schervish. Probability and Statistics. 4th Ed. - 4o capítulo Ilya M. Sobol. A Primer for the Monte

Leia mais

TAD dicionário. Métodos do TAD dicionário:

TAD dicionário. Métodos do TAD dicionário: TAD dicionário O TAD dicionário modela uma coleção buscável de itens chave-elemento As principais operações em dicionários são busca, inserção e remoção de itens Vários itens com a mesma chave são permitidos

Leia mais

Aula de hoje. administração. São Paulo: Ática, 2007, Cap. 3. ! Tópicos. ! Referências. ! Distribuição de probabilidades! Variáveis aleatórias

Aula de hoje. administração. São Paulo: Ática, 2007, Cap. 3. ! Tópicos. ! Referências. ! Distribuição de probabilidades! Variáveis aleatórias Aula de hoje! Tópicos! Distribuição de probabilidades! Variáveis aleatórias! Variáveis discretas! Variáveis contínuas! Distribuição binomial! Distribuição normal! Referências! Barrow, M. Estatística para

Leia mais

Estatística e Modelos Probabilísticos - COE241

Estatística e Modelos Probabilísticos - COE241 Estatística e Modelos Probabilísticos - COE241 Aulas passadas Motivação Exemplos de aplicação de probabilidade e estatística Informações do curso Aula de hoje Espaço amostral Álgebra de Eventos Eventos

Leia mais

4. PRINCIPAIS MODELOS DISCRETOS

4. PRINCIPAIS MODELOS DISCRETOS 4. PRINCIPAIS MODELOS DISCRETOS 2011 Principais modelos probabilísticos discretos 4.1. Modelo Bernoulli Muitos eperimentos admitem apenas dois resultados. Eemplos: 1. Uma peça é classificada como defeituosa

Leia mais

3 a Lista de PE Solução

3 a Lista de PE Solução Universidade de Brasília Departamento de Estatística 3 a Lista de PE Solução. Se X representa o ganho do jogador, então os possíveis valores para X são,, 0, e 4. Esses valores são, respectivamente, correspondentes

Leia mais

Tabelas Hash. Prof. Túlio Toffolo BCC202 Aulas 23 e 24 Algoritmos e Estruturas de Dados I

Tabelas Hash. Prof. Túlio Toffolo  BCC202 Aulas 23 e 24 Algoritmos e Estruturas de Dados I Tabelas Hash Prof. Túlio Toffolo http://www.toffolo.com.br BCC202 Aulas 23 e 24 Algoritmos e Estruturas de Dados I Pesquisa em Memória Primária Introdução - Conceitos Básicos Pesquisa Sequencial Pesquisa

Leia mais

Tabelas de hash Acabamos de estudar como implementar uma tabela hashing aberta e estudaremos agora como implementar uma tabela hashing fechada ou

Tabelas de hash Acabamos de estudar como implementar uma tabela hashing aberta e estudaremos agora como implementar uma tabela hashing fechada ou Tabelas de hash Acabamos de estudar como implementar uma tabela hashing aberta e estudaremos agora como implementar uma tabela hashing fechada ou também denominada de tabela hashing com endereçamento aberto.

Leia mais

PCC104 - Projeto e Análise de Algoritmos

PCC104 - Projeto e Análise de Algoritmos PCC104 - Projeto e Análise de Algoritmos Marco Antonio M. Carvalho Departamento de Computação Instituto de Ciências Exatas e Biológicas Universidade Federal de Ouro Preto 1 de novembro de 2018 Marco Antonio

Leia mais

Conjuntos disjuntos. Objectivo resolver eficientemente o problema da equivalência estrutura de dados simples (vector) implementação rápida

Conjuntos disjuntos. Objectivo resolver eficientemente o problema da equivalência estrutura de dados simples (vector) implementação rápida Conjuntos disjuntos Objectivo resolver eficientemente o problema da equivalência estrutura de dados simples (vector) implementação rápida Desempenho análise complicada Uso problemas de grafos equivalência

Leia mais

Hashing convencional...

Hashing convencional... Hashing M.C.F. de Oliveira & Cristina Ciferri 2006/2007 Fonte: Folk & Zoelick, File Structures 1 Hashing convencional... Revisão... 2 1 Hashing 0 chave de busca K = LOWELL h(k) endereço 4 1 2 3 4 5...

Leia mais

Variáveis Aleatórias Discretas e Distribuição de Probabilidade

Variáveis Aleatórias Discretas e Distribuição de Probabilidade Variáveis Aleatórias Discretas e Distribuição de Probabilidades - parte II 29 de Março de 2011 Distribuição Uniforme Discreta Média Propriedade da falta de memória Objetivos Ao final deste capítulo você

Leia mais

Processos Estocásticos e Cadeias de Markov Discretas

Processos Estocásticos e Cadeias de Markov Discretas Processos Estocásticos e Cadeias de Markov Discretas Processo Estocástico(I) Definição: Um processo estocástico é uma família de variáveis aleatórias {X(t) t T}, definidas em um espaço de probabilidades,

Leia mais

Aprendizado, minimização do arrependimento e equilíbrio (Learning, Regret Minimization, and Equilibria)

Aprendizado, minimização do arrependimento e equilíbrio (Learning, Regret Minimization, and Equilibria) Aprendizado, minimização do arrependimento e equilíbrio (Learning, Regret Minimization, and Equilibria) Victor Alberto Romero Instituto de Matemática e Estatística Universidade de São Paulo Teoria dos

Leia mais

Métodos de Monte Carlo

Métodos de Monte Carlo prcjunior@inf.ufpr.br VRI Visão Robótica e Imagem Universidade Federal do Paraná Introdução são métodos estatísticos baseados em amostragens aleatórias ou pseudoaleatórias Tempo de execução determinístico

Leia mais

Non-clairvoyant Scheduling Games

Non-clairvoyant Scheduling Games 1/35 Non-clairvoyant Scheduling Games Mijail Gamarra Holguin 9 de novembro de 2012 /35 Agenda 1 Introdução Definições Preliminares 2 Equiĺıbrio de Nash Random em máquinas uniformes Random em máquinas não

Leia mais

Variável Aleatória Poisson. Número de erros de impressão em uma

Variável Aleatória Poisson. Número de erros de impressão em uma EST029 Cálculo de Probabilidade I Cap. 7. Principais Variáveis Aleatórias Discretas Prof. Clécio da Silva Ferreira Depto Estatística - UFJF Variável Aleatória Poisson Caraterização: Usa-se quando o experimento

Leia mais

2 Teoria da Informação

2 Teoria da Informação 2 Teoria da Informação Neste capítulo apresentamos alguns conceitos básicos sobre Teoria da Informação que utilizaremos durante este trabalho. 2.1 Alfabeto, texto, letras e caracteres Um alfabeto Σ = (σ

Leia mais

Estruturas de Dados Tabelas de Espalhamento

Estruturas de Dados Tabelas de Espalhamento Estruturas de Dados Tabelas de Espalhamento Prof. Eduardo Alchieri (introdução) Uma estrutura como, as árvores binárias de busca, que trabalhe na ordem de log n é muito eficiente, mas em algumas situações

Leia mais

Estatística e Modelos Probabilísticos - COE241

Estatística e Modelos Probabilísticos - COE241 Estatística e Modelos Probabilísticos - COE241 Aula passada Probabilidade Condicional Independência de Eventos Teorema da Probabilidade Total Lei de Bayes Aula de hoje Exemplo Lei de Bayes Variáveis Aleatórias

Leia mais

TE802 Processos Estocásticos em Engenharia. Valores Esperados de Somas de Variáveis Aleatórias. TE802 Somas de Variáveis Aleatórias

TE802 Processos Estocásticos em Engenharia. Valores Esperados de Somas de Variáveis Aleatórias. TE802 Somas de Variáveis Aleatórias TE802 Processos Estocásticos em Engenharia Somas de Variáveis Aleatórias 27 de setembro de 2017 Valores Esperados de Somas de Variáveis Aleatórias Seja W n = X 1 + + X n, E[W n ] = E[X 1 ] + E[X 2 ] +

Leia mais

Hashing. Hashing. Hashing versus Indexação. Hashing. Hashing convencional... Exemplo de espalhamento. Revisão...

Hashing. Hashing. Hashing versus Indexação. Hashing. Hashing convencional... Exemplo de espalhamento. Revisão... Algoritmos e Estruturas de Dados II Hashing Prof Debora Medeiros Hashing convencional Revisão Adaptado dos Originais de: Maria Cristina F de Oliveira Cristina Ciferri Hashing Exemplo de espalhamento 0

Leia mais

DISTRIBUIÇÃO AMOSTRAL DA

DISTRIBUIÇÃO AMOSTRAL DA DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO Lucas Santana da Cunha email: lscunha@uel.br http://www.uel.br/pessoal/lscunha/ Universidade Estadual de Londrina 25 de setembro de 2017 Distribuição amostral da proporção

Leia mais

5 TORIA ELEMENTAR DA AMOSTRAGEM

5 TORIA ELEMENTAR DA AMOSTRAGEM 5 TORIA ELEMENTAR DA AMOSTRAGEM É errôneo pensar que, caso tivéssemos acesso a todos os elementos da população, seríamos mais precisos. Os erros de coleta e manuseio de um grande número de dados são maiores

Leia mais

Luís Fernando Schultz Xavier da Silveira. 12 de maio de 2010

Luís Fernando Schultz Xavier da Silveira. 12 de maio de 2010 Monóides e o Algoritmo de Exponenciação Luís Fernando Schultz Xavier da Silveira Departamento de Informática e Estatística - INE - CTC - UFSC 12 de maio de 2010 Conteúdo 1 Monóides Definição Propriedades

Leia mais

MC102 Aula 26. Instituto de Computação Unicamp. 17 de Novembro de 2016

MC102 Aula 26. Instituto de Computação Unicamp. 17 de Novembro de 2016 MC102 Aula 26 Recursão Instituto de Computação Unicamp 17 de Novembro de 2016 Roteiro 1 Recursão Indução 2 Recursão 3 Fatorial 4 O que acontece na memória 5 Recursão Iteração 6 Soma em um Vetor 7 Números

Leia mais

SUMÁRIO. 1.1 Introdução, Conceitos Fundamentais, 2

SUMÁRIO. 1.1 Introdução, Conceitos Fundamentais, 2 SUMÁRIO 1 CONCEITOS BÁSICOS, 1 1.1 Introdução, 1 1.2 Conceitos Fundamentais, 2 1.2.1 Objetivo, 2 1.2.2 População e amostra, 2 1.3 Processos estatísticos de abordagem, 2 1.4 Dados estatísticos, 3 1.5 Estatística

Leia mais

EELT-7035 Processos Estocásticos em Engenharia. Variáveis Aleatórias. EELT-7035 Variáveis Aleatórias Discretas. Evelio M. G.

EELT-7035 Processos Estocásticos em Engenharia. Variáveis Aleatórias. EELT-7035 Variáveis Aleatórias Discretas. Evelio M. G. EELT-7035 Processos Estocásticos em Engenharia Variáveis Aleatórias Discretas 21 de março de 2019 Variáveis Aleatórias Variável aleatória, X( ): função que mapeia o espaço amostral (S) em números pertencentes

Leia mais

é uma proposição verdadeira. tal que: 2 n N k, Φ(n) = Φ(n + 1) é uma proposição verdadeira. com n N k, tal que:

é uma proposição verdadeira. tal que: 2 n N k, Φ(n) = Φ(n + 1) é uma proposição verdadeira. com n N k, tal que: Matemática Discreta 2008/09 Vítor Hugo Fernandes Departamento de Matemática FCT/UNL Axioma (Princípio da Boa Ordenação dos Números Naturais) O conjunto parcialmente (totalmente) ordenado (N, ), em que

Leia mais

37 a Olimpíada Brasileira de Matemática Nível Universitário Primeira Fase

37 a Olimpíada Brasileira de Matemática Nível Universitário Primeira Fase 7 a Olimpíada Brasileira de Matemática Nível Universitário Primeira Fase Problema Sejam m e n inteiros positivos, X um conjunto com n elementos e seja 0 k n um inteiro. São escolhidos aleatória e independentemente

Leia mais

HASHING Hashing Motivação - Acesso Direto:

HASHING Hashing Motivação - Acesso Direto: Hashing é uma técnica que busca realizar as operações de inserção, remoção e busca em tempo constante. Motivação - Acesso Direto: Suponha que existam n chaves a serem armazenadas em uma tabela T, seqüencial

Leia mais

SSC0611 Arquitetura de Computadores

SSC0611 Arquitetura de Computadores SSC0611 Arquitetura de Computadores 5ª e 6ª Aulas Revisão de Hierarquia de Memória Profa. Sarita Mazzini Bruschi sarita@icmc.usp.br 1 Memória Memória Todo componente capaz de armazenar bits de informação

Leia mais

i a[i]

i a[i] Técnicas de Hashing Outra forma de se fazer busca em uma tabela, é construir-se a tabela de forma a facilitar a busca, colocando-se cada elemento numa posição pré-determinada. Tal posição é obtida aplicando-se

Leia mais

Sexta Lista: Geração de Números Pseudo-Aleatórios e Método de Monte Carlo

Sexta Lista: Geração de Números Pseudo-Aleatórios e Método de Monte Carlo Sexta Lista: Geração de Números Pseudo-Aleatórios e Método de Monte Carlo Antônio Carlos Roque da Silva Filho e Cristiano R. F. Granzotti 26 de junho de 2017 Os exercícios desta lista devem ser resolvidos

Leia mais

SCX5005 Simulação de Sistemas Complexos II. Problemas em Simulação

SCX5005 Simulação de Sistemas Complexos II. Problemas em Simulação SCX5005 Simulação de Sistemas Complexos II Alguns Marcelo S. Lauretto Referências: Morris DeGroot, Mark Schervish. Probability and Statistics. 4th Ed. - 4o capítulo Ilya M. Sobol. A Primer for the Monte

Leia mais

universidade federal de pernambuco departamento de estatística

universidade federal de pernambuco departamento de estatística soluções do o exercício escolar Teoria da Informação set./207 a) Qual a variável aleatória de maior incerteza? Surpreendentemente, há uma maior incerteza sobre a variável aleatória X, é definida apenas

Leia mais

Modelos de Distribuição PARA COMPUTAÇÃO

Modelos de Distribuição PARA COMPUTAÇÃO Modelos de Distribuição MONITORIA DE ESTATÍSTICA E PROBABILIDADE PARA COMPUTAÇÃO Distribuições Discretas Bernoulli Binomial Geométrica Hipergeométrica Poisson ESTATÍSTICA E PROBABILIDADE PARA COMPUTAÇÃO

Leia mais

Probabilidades e Estatística MEEC, LEIC-A, LEGM

Probabilidades e Estatística MEEC, LEIC-A, LEGM Departamento de Matemática Probabilidades e Estatística MEEC, LEIC-A, LEGM Exame a Época / o Teste (Grupos III e IV) o semestre 009/00 Duração: 80 / 90 minutos /06/00 9:00 horas Grupo I Exercício 5 valores

Leia mais

Professora Ana Hermínia Andrade. Universidade Federal do Amazonas Faculdade de Estudos Sociais Departamento de Economia e Análise. Período 2017.

Professora Ana Hermínia Andrade. Universidade Federal do Amazonas Faculdade de Estudos Sociais Departamento de Economia e Análise. Período 2017. Professora Ana Hermínia Andrade Universidade Federal do Amazonas Faculdade de Estudos Sociais Departamento de Economia e Análise Período 2017.1 Distribuições Amostrais O intuito de fazer uma amostragem

Leia mais