PESQUISA DE MOTIVOS. Relatório 3. Ana Calhau Ângela Pisco Nuno Santos

Tamanho: px
Começar a partir da página:

Download "PESQUISA DE MOTIVOS. Relatório 3. Ana Calhau Ângela Pisco Nuno Santos"

Transcrição

1 Disciplina de BIOLOGIA COMPUTACIONAL Mestrado em ENGENHARIA BIOMÉDICA 4º Ano, 1º Semestre 2007/08 PESQUISA DE MOTIVOS Relatório 3 Ana Calhau Ângela Pisco Nuno Santos Palavras-Chave: Pesquisa de Motivos, Perfil, Consenso, MEME, RISO, MUSA, Força bruta Resumo Com este trabalho pretendeu-se ultrapassar o problema da identificação de motivos nas regiões promotoras de genes, genes esses envolvidos na possível ligação a factores de transcrição (FT) que modulam as alterações da expressão genética. Numa primeira abordagem identificaram-se os motivos recorrendo-se a conceitos teóricos. Observou-se ainda o logo dos motivos utilizando o programa WebLogo. Numa segunda abordagem, pretendeu-se analisar um conjunto de regiões promotoras da bactéria Pseudomonas putida KT2440 recorrendo-se agora a um conjunto de algoritmos de identificação de motivos disponibilizados pelo MEME, RISO e MUSA, tendo ficado evidentes as suas potencialidades e limitações. Por último, implementou-se o algoritmo de força bruta para resolver o problema de Motif Finding, tendo-se tentado encontrar os parâmetros óptimos. 1. MOTIVOS: PERFIL E CONSENSO Considerou-se a seguinte tabela, que contém 10 padrões que representam um motivo de tamanho L=8: Tabela 1 Padrões representativos de um motivo de tamanho Construção de um alinhamento de todas as instâncias do motivo representado Sendo um motivo um conjunto de subsequências de comprimento fixo e sabendo que o motivo pretendido tem tamanho L=8, as instâncias do motivo, bem como o alinhamento destas são:

2 Pesquisa de Motivos Figura 1 Alinhamento de todas as instâncias do motivo 1.2 Representação do motivo utilizando um perfil O perfil consiste na construção de uma matriz que evidencia a variabilidade da composição de nucleótidos para cada posição, tendo em conta uma escolha particular de motivos. Desta forma, obtém-se: Tabela 2 Representação em perfil do motivo A C T G Representação do motivo utilizando uma sequência de consenso Após a determinação do perfil, é possível estabelecer qual a sequência consenso, podendo esta ser vista como um motivo ancestral, a partir do qual os motivos mutados emergem. Esta sequência apresenta em cada posição o nucleótido com o score mais elevado. Por esta razão, com base nas instâncias dos motivos seleccionadas, é possível encontrar mais do que uma sequência consenso, pois para cada posição existem nucleótidos com igual frequência. Assim, encontraram-se as seguintes sequências consenso: ACTCATGG AATCATGG ACGCATGG AAGCATGG Figura 2 Sequências consenso 2

3 Ana Calhau Ângela Pisco Nuno Santos 1.4 Determinação da importância do perfil obtido, utilizando como medida de mérito a entropia A entropia define as frequências de ocorrência de cada nucleótido em cada coluna do alinhamento múltiplo efectuado. Desta forma, a entropia de um alinhamento múltiplo é definida pela soma da entropia de cada coluna. Concretamente para o nosso caso temos: (1) onde p x (j) corresponde à probabilidade de o nucleótido X surgir na posição j do perfil determinado. Coluna 1 = 0,7log 2 (0,7) + 0,1log 2 (0,1) + 0,2log 2 (0,2) = Coluna 2 = 0,5log 2 (0,5) + 0,5log 2 (0,5) = -1 Coluna 3 = 0,5log 2 (0,5) + 0,5log 2 (0,5) = -1 Coluna 4 = 0,2log 2 (0,2) + 0,8log 2 (0,8) = Coluna 5 = 0,8log 2 (0,8) + 0,2log 2 (0,2) = Coluna 6 = 0,1log 2 (0,1) + 0,2log 2 (0,2) + 0,5log 2 (0,5) + 0,2log 2 (0,2) = Coluna 7 = 0,9 log 2 (0,9) + 0,1 log 2 (0,1) = Coluna 8 = 1 log 2 (1) = 0 Assim, com base em (1), a entropia do perfil apresentado é de -6, Ao se utilizar como medida de mérito a entropia há que ter em conta que se esta for zero o alinhamento feito corresponde ao melhor possível e portanto o perfil apresenta a conservação máxima. Tal ocorre quando não existem mutações nas instâncias do motivo representado. Neste caso particular, o pior alinhamento possível corresponderia a uma entropia de -15,77 [(2*(0,2log 2 0,2)+2*(0,3log 2 0,3))*8], que ocorre quando os nucleótidos estão igualmente distribuídos por todas as colunas. Como a entropia obtida apresenta um valor mais próximo de 0 do que de é possível concluir que este perfil se encontra relativamente conservado, pelo que tem uma importância significativa. 1.5 Contrução de um Logo para o alinhamento de sequências utilizando o programa WebLogo O WebLogo é uma aplicação web que permite a criação de logos de forma fácil e simples. Estes logos são representações gráficas correspondentes ao alinhamento múltiplo de sequências de aminoácidos ou ácidos nucleicos e são formados por pilhas de símbolos (letras) em cada posição da sequência. Se se trata de uma região muito conservada, essa pilha será formada por poucos símbolos ou até mesmo só por um, se for pouco conservada é formada por vários. Além disso, se for uma zona muito conservada a pilha tem uma altura elevada, isto porque Altura da base k na posição i = P k (i)d(i) (2) em que D(i) é a entropia de Shannon na posição i. A frequência relativa de cada aminoácido ou ácido nucleico, em cada posição, é dada pela altura do símbolo que lhe corresponde. 3

4 Pesquisa de Motivos Figura 3 Representação de um logo resultante do alinhamento múltiplo de sequências 1 Pela análise do logo apresentado, é possível observar que a posição 8 é a posição mais conservada, seguida da posição 7 e depois das posições 4 e 5. A posição 2 apresenta igual quantidade de adeninas e citosinas e a posição de 3 igual quantidade de timinas e guaninas. A posição 1 apresenta maior quantidade de adeninas mas também se verificam outros nucleótidos como citosinas e timinas. Na posição 6 embora não se observe qualquer nucleótido, tal é enganador. Se se ampliasse esta imagem, no weblogo, começaria a ser visível a letra e cor correspondente à timina (o T vermelho). Nesta posição se não se tiver uma timina, tem-se uma citosina ou uma guanina as quais têm igual probabilidade. Como o tamanho de cada base no logo é determinado por (2), T não surge com uma grande expressão. Este tipo de representação permite uma descrição mais precisa e rica, face às representações anteriores, podendo revelar rapidamente características importantes do alinhamento, que de outra forma seriam difíceis de perceber. Uma grande vantagem é a fácil intuição da sequência consenso do alinhamento dos motivos, já que é bastante rápido identificar visualmente as bases mais comuns para cada posição. 1.6 Cálculos Considerando que a probabilidade de uma dada sequência (de tamanho L=8) estar a uma distância de Hamming 1 da sequência consenso encontrada é o número de vezes que se espera encontrar uma sequência a uma distância de Hamming igual a 1 numa sequência de tamanho é igual a Quanto ao número de vezes que se espera encontrar exactamente esta sequência de consenso (distância de Hamming igual a 0) numa sequência de tamanho , este rondará os 1 Figura retirada de [2] 4

5 Ana Calhau Ângela Pisco Nuno Santos 2. FERRAMENTAS PARA PESQUISA DE MOTIVOS A bactéria que serviu de modelo a este estudo foi Pseudomonas putida KT2440, cujo genoma está já sequenciado. Nos estudos de sequências desta bactéria foi identificada uma sequência consenso, reconhecida pela RNApolimerase, com o factor sigma alternativo σ 54. O que se pretende nesta parte do trabalho é identificar, recorrendo a três métodos diferentes de pesquisa de motivos, a sequência consenso, reconhecida pelo factor σ 54. Para tal analisou-se um conjunto de sessenta e nove regiões promotoras, de forma a poder concluir-se qual é a sequência consenso à qual se liga este factor de transcrição. A sequência consenso que se pretende identificar é mrnrtggcacg-n4-ttgcwnnw [3]. 2.1.MEME O MEME [4] é um modelo estatístico, bastante utilizado na identificação de regiões conservadas, em sequências desalinhadas de DNA (e também de proteínas). As sequências em estudo são partidas em subsequências de tamanho n. São identificadas as subsequências semelhantes, sendo as sequências originais alinhadas de forma a que as subsequências candidatas a motivo fiquem alinhadas. O algoritmo, após este processo inicial, consiste em dois passos. O primeiro, expectation step, consiste em utilizar a composição, coluna a coluna, do local para estimar a probabilidade de encontrar a base em questão em qualquer posição de cada sequência. No segundo passo, maximization step, as bases encontradas para cada posição do local são substituídas pelo conjunto encontrado no passo anterior. Submeteu-se o ficheiro que se pretendia testar, deixando todos os parâmetros com os valores pré-definidos. Obtiveram-se três motivos, abaixo indicados. Figura 4 Motivos obtidos com o algoritmo MEME 2 Tabela 3 Resultados fornecidos pelo MEME em relação ao tempo que demorou a pesquisa do motivo e também em relação à expressão regular do motivo. Motivo Regular expression Tempo (segundos) 1 G[CT]TGGCA[CT][GA][GC][GCT][TCG]CTTGCT 458,85 2 [CG][CG]T[CG]TTCGCGGG[TC][AG][AC][AG]CCCGCTCC[TC]AC[AG][GAC] 910,07 3 G[GC]C[CT][CT][CT]TTC[GA]CGGG[CT]A[AT][GA]CCCGC[TG]CC[CT]AC 1359,63 Por análise da tabela é possível concluir que quanto maior o motivo, mais tempo demora a 2 Imagem extraída de [4] 5

6 Pesquisa de Motivos ser compilado pelo algoritmo. As bases entre parêntisis rectos são as possíveis, de acordo com a sequência consenso do motivo, para a posição correspondente. 2.2.RISO Este algoritmo é do tipo combinatório [5]. Utiliza uma estrutura de dados diferente da anterior, que são caixas ligadas (boxs), nas quais é guardada a informação sobre as regiões conservadas. Este tipo de regiões conservadas, designadas por motivos estruturados, são extremamente relevantes na pesquisa por mecanismos regulatórios de genes. Com este método é possível encontrar motivos complexos, distanciados entre si de um número variável de pares de bases. Em termos do modelo, tal corresponde a ter mais do que uma box, onde o espaço que separa as boxs consecutivas é variável e possível de definir pelo utilizador, bem como o tamanho de cada caixa do motivo. Tem uma desvantagem muito significativa, que é a necessidade de introduzir muitos parâmetros, os quais na maioria dos casos não são conhecidos à partida, tais como o tamanho dos motivos, o número de erros permitidos e ainda o número de caixas pelas quais é constituído o motivo. Foi carregado o mesmo ficheiro e utilizados os parâmetros abaixo indicados. Todos os restantes foram deixados com o valor de default. Figura 5 Parâmetros fornecidos ao algoritmo RISO O resultado obtido encontra-se na figura seguinte. Figura 6 Resultados obtidos com o algoritmo RISO Tentou fazer-se uma pesquisa mais genérica, na qual se estendiam as boxs às partes em que o consenso que se pretende encontrar não está bem definido. No entanto este resultado não se 6

7 Ana Calhau Ângela Pisco Nuno Santos consegue analisar, pois o ficheiro de output excede o limite permitido pelo programa. Os resultados obtidos apresentam bastante relevância estatística, como se pode constatar pelos valores de Chi2 e Z-Score. Nada garante, porém, que esta relevância estatística seja também importância biológica. Há que constatar que o primeiro resultado, ou seja, aquele que reuniu um maior consenso, é exactamente o que se pretendia encontrar. Por outro lado a obtenção do resultado foi bastante rápida, sustentando-se assim a descrição feita do algoritmo [5]. 2.3.MUSA Este modelo de pesquisa é também um algoritmo do tipo combinatório [6]. O que faz é procurar por motivos simples e estruturados num dado conjunto de sequências de DNA. A sua grande vantagem é que não precisa de detalhes sobre a estrutura do motivo complexo para fazer a pesquisa. Pode ser utilizado tanto para pesquisa de motivos complexos, como para estimar parâmetros de pesquisa para outros algoritmos. Consiste num algoritmo de biclustering, que opera numa matriz de co-ocorrências de pequenos motivos. O método é independente da estrutura do motivo, já que faz poucos compromissos com as suas características. O algoritmo foi testado para o conjunto de promotores que se encontra em estudo neste trabalho e os resultados obtidos indicaram que esta abordagem é bastante exacta na identificação de motivos complexos com significância biológica [6]. Concretamente nesta situação o que se fez foi carregar o mesmo ficheiro que no ponto anterior. Está indicado na figura seguinte o resultado, de forma parcial. Figura 7 Resultados obtidos com o algoritmo MUSA O tempo gasto na obtenção deste resultado foi estimado à volta dos 900 segundos, bastante mais do que o necessário para o RISO. 2.4.Comparação dos resultados Tal como tem vindo a ser discutido ao longo desta secção, os resultados obtidos pelos três algoritmos estão bastante próximos do esperado. É importante ter em linha de consideração que os algoritmos combinatórios, apesar de por vezes mais lentos, são mais exactos que os estatísticos. O melhor resultado (melhor relação solução vs tempo) foi obtido com o algoritmo RISO, para o qual se considera que o motivo mais relevante é aquele que dá exactamente o pretendido, isto é, coincide exactamente com a região mais conservada do motivo que se 7

8 Pesquisa de Motivos pretendia identificar. Para o MEME assume-se que o motivo mais relevante é o primeiro. São duas as razões que sustentam esta afirmação. Por um lado é aquele que apresenta maior número de bases semelhantes com a sequência consenso que se pretende identificar. Por outro é o que apresenta o menor valor-e. O valor-e de uma sequência é o número expectável de sequências existentes numa base de dados aleatória com o mesmo tamanho e que terão os mesmos motivos correspondentes que a sequência em estudo tem, pelo que quanto menor o seu valor, menor essa probabilidade e mais importante é o motivo. O algoritmo MUSA apresenta uma vantagem, já acima referida, face aos dois anteriores, que é não precisar que se definam os parâmetros do modelo à partida. Estes parâmetros aqui estimados podem por exemplo ser utilizados no RISO, já que este algoritmo é bastante exigente neste aspecto. O quarto resultado apresentado por este método é bastante próximo daquele que se pretendia. O valor-p para este motivo é bastante pequeno. O valor-p de um score é definido como a probabilidade de que uma sequência aleatória do mesmo comprimento contenha correspondências com score igual ou maior. Em termos do significado biológico que as sequências obtidas contêm, há que ter em conta duas situações, dado que os motivos obtidos são ordenados por ordem decrescente da sua relevância nos testes estatísticos. A significância estatística, em termos gerais, determina a probabilidade do motivo considerado ser encontrado numa sequência aleatoriamente gerada. Por um lado, nem todos os resultados estatisticamente significativos são biologicamente relevantes, dado que pelo motivo não aparecer numa sequência random, isso não quer dizer que seja importante ao nível da informação biológica que codifica. Por outro lado, existem motivos biologicamente importantes que surgem com grande probabilidade em sequências random, razão pela qual não têm significância estatística, sendo descorados a priori. Há ainda um outro aspecto a focar, que é a ausência de caixas TATA com relevância estatística. Tal deve-se ao que foi dito no parágrafo acima. No entanto era expectável ter sido encontrado uma maior número, já que o conjunto analisado é um conjunto de promotores, que por definição têm sequências TATA. 3. ALGORITMO PARA PESQUISA DE MOTIVOS Entre os genes presentes num genoma, existem segmentos de cadeias de DNA que possuem uma ou várias zonas semelhantes entre si, designados por motivos. O desejo de encontrar esses motivos, isto é, de solucionar o problema de Motif Finding, foi a motivação do algoritmo de força bruta. Este algoritmo consiste em encontrar um motivo de tamanho L em várias sequências de DNA (T amostras), de tamanho N cada uma, de forma unívoca. Para isso, o método considera todas as combinações de motivos existentes entre as várias sequências de DNA, calcula o score de cada uma e extrai o melhor entre elas. Desta última, obtém a sequência consenso, extraindo também os índices correspondentes ao nucleótido onde inicia cada motivo nas diferentes sequências. Apesar deste algoritmo retornar um valor exacto, na medida em que o resultado possui o score mais elevado de todos os possíveis, o seu tempo de execução é computacionalmente bastante pesado, uma vez que é da ordem de O ( L N T ). Em cada sequência, o algoritmo fixa-se num determinado nucleótido i e constrói o motivo, a partir dele até ao nucleótido i + L -1. Assim, para cada sequência, o algoritmo faz N L + 1 operações, mas como existem T sequências, no total fará (N-L+1) T operações. A estas operações simples incluem-se a determinação do score, assim como o alinhamento e a determinação do motivo consenso. Por serem operações finitas, ou seja, o seu número ser constante à medida que o algoritmo decorre, não têm influência na ordem de grandeza do método. No entanto, estas operações são feitas L vezes, uma vez que o motivo tem esse tamanho. Desta forma obtém-se a ordem de grandeza referida antes. De forma a completar este raciocínio, decidiu testar-se computacionalmente o algoritmo de 8

9 Ana Calhau Ângela Pisco Nuno Santos força bruta. Para isso, este foi implementado no software MatLab. Na tabela seguinte são apresentados os valores temporais de duração da execução do algoritmo para os diferentes valores de N, T e L. Tabela 4 Estudo do desempenho do algoritmo com a variação dos parâmetros do sistema N T L Tempo (s) Tempo (min) Através dos valores obtidos foi possível construir três gráficos de relação N/T/L versus tempo, e assim confirmar o seu tempo de duração Figura 8 Representação dos pontos e do gráfico da interpolação desses pontos, cuja relação é N com o tempo, em segundos. A interpolação foi obtida em software Mathematica, tendo como funções de base 1, x, x 2 e x 3. 9

10 Pesquisa de Motivos Figura 9 Representação dos pontos e do gráfico da interpolação desses pontos, cuja relação é L com o tempo, em segundos. A interpolação foi obtida em software Mathematica, tendo como funções de base 1 e x Figura 10 Representação dos pontos e do gráfico da interpolação desses pontos, cuja relação é T com o tempo, em segundos. A interpolação foi obtida em software Mathematica, tendo como funções de base 1 e 25 x. Por análise dos gráficos, facilmente se observa um crescimento polinomial, de grau 3 (pois a análise foi feita com T = 3) ao se aumentar N, e um crescimento exponencial, de base 25 (valor do N), aquando do aumento de T. Relativamente à figura 9, esperar-se-ia um crescimento linear do tempo de execução. No entanto este diminui sempre, lentamente para L próximo da unidade e com maior gradiente para L próximo de N. Uma vez que a parcela N T tem uma componente que varia com L (de facto tem-se (N L +1) T, como já foi referido), em ordens de grandeza equivalentes o L torna-se significativo e faz diminuir a base N L + 1. Neste caso específico em que se considerou N = 50, a contribuição do L no produto com (N L + 1) T é menor que a sua influência na base. Assim, à medida que o L aumenta, o tempo de execução diminui. Uma hipótese para uma melhor visualização do comportamento linear positivo, ou seja, tornar a contribuição do L na base desprezável, seria escolher valores de forma a ter N >>> L, o que em contra partida tornaria o tempo de execução do algoritmo bastante elevado, razão pela qual não foi testado. 10

11 Ana Calhau Ângela Pisco Nuno Santos Através dos resultados obtidos, é possível chegar a uma conclusão do dimensionamento dos parâmetros considerados, tendo em conta a sua utilidade como algoritmo de pesquisa de motivos. Para tal considera-se que o algoritmo é bem dimensionado desde que o seu tempo de execução não ultrapasse 1 hora, visto que existem outras soluções mais rápidas e quase tão exactas como este método. É preciso ter em atenção que os tempos de execução variam com o processador e por isso dimensiona-se os parâmetros de forma subjectiva em forma de intervalos. O comprimento máximo das cadeias de DNA (N) deverá rondar entre os 250 e os 400 nucleótidos, para se poder ter até 4 a 6 sequências (T). No que toca ao tamanho do motivo (L), este poderá ser qualquer valor dentro da gama de N, visto que para sequências pequenas, o seu tempo de execução não varia muito, baixando mesmo para valores de L próximos de N. O ficheiro teste (promotores.txt) possui 4 cadeias de DNA, tendo cada uma 50 nucleótidos. Ao se testar o algoritmo para este ficheiro, e procurando com L = 7, encontra-se o motivo consenso ACGTATT. Este é formado pelos motivos: acgtatt a partir dos nucleótidos 26, 21, 3 e 38 das sequências 1, 2, 3 e 4 respectivamente. Este alinhamento cria assim um score de CONCLUSÃO A pesquisa de motivos é um tema bastante actual. Do ponto de vista biológico reveste-se de toda a importância na medida em que permite inferir regiões reguladoras, que por terem um papel tal que não pode ser descurado, são mantidas durante toda a evolução. Por outro lado permite ainda inferir relações filogenéticas, já que a sequência consenso é encarada como um motivo ancestral, do qual emergem todos os restantes motivos. A utilização da entropia como medida de mérito da representação em perfil é bastante adequada, já que a entropia varia linearmente com a ordem da representação em perfil, pelo que quanto maior a entropia, mais conservado é o motivo, e consequentemente mais importante. Mais uma vez pôde constatar-se que existem inúmeras ferramentas disponíveis on-line, as quais permitem fazer praticamente todos os tipos de testes pretendidos de forma simples e mais ou menos rápida. Foram utilizadas apenas três, duas das quais são bastante recentes, o que mostra que esta área está ainda em grande expansão. O algoritmo de força bruta implementado, apesar de dar como output o melhor resultado, não é utilizável para um elevado número de sequências, já que a complexidade neste parâmetro é exponencial, de base n, com n correspondente ao comprimento de cada sequência de DNA. 5. BIBLIOGRAFIA [1] Freitas, Ana T., Pesquisa de Motivos, Guia do 3º Laboratório de Biologia Computacional, Outubro de 2007 [2] T.D. Schneider and R.M. Stephens Sequence Logos: A New Way to Display Consensus Sequences. Nucleic Acids Res. 18: [3] Barrios H, Valderrama B., Morett E. (1999) Compilation and analysis of σ 54 - dependent promoter sequences. Nucleic Acids Research 27: [4] Timothy L. Bailey and Michael Gribskov, "Combining evidence using p-values: application to sequence homology searches", Bioinformatics, 14(48-54), 1998 [5] Carvalho A. M. and Freitas A. T. and Oliveira A. L. and Sagot M-F, An Efficient Algorithm for the Identification of Structured Motifs in DNA Promoter Sequences, IEEE Transactions on Computational Biology and Bioinformatics, 3(2), pp , Apr [6] Mendes N.D., Casimiro A.C., Santos P.M., Sá-Correia I., Oliveira A.L., Freitas A.T., MUSA: A parameter free algorithm for the identification of biologically significant motifs, Bioinformatics 22, ,

MODELOS PROBABILÍSTICOS

MODELOS PROBABILÍSTICOS Disciplina de BIOLOGIA COMPUTACIONAL Mestrado em ENGENHARIA BIOMÉDICA 4º Ano, 1º Semestre 2007/08 MODELOS PROBABILÍSTICOS Relatório 4 Ana Calhau Ângela Pisco Nuno Santos 54605 55748 55746 Palavras-Chave:

Leia mais

alinhamento global-alinhamento múltiplo de seqüências

alinhamento global-alinhamento múltiplo de seqüências alinhamento global-alinhamento múltiplo de seqüências Alinhamento múltiplos de seqüências Qual a importância de se realizar alinhamentos múltiplos em oposição a alinhamentos em pares? Alinhamento múltiplos

Leia mais

Ferramentas da Bioinformática para a descodificação do ADN. Daniel Sobral Unidade de Bioinformática do IGC

Ferramentas da Bioinformática para a descodificação do ADN. Daniel Sobral Unidade de Bioinformática do IGC Ferramentas da Bioinformática para a descodificação do ADN Daniel Sobral Unidade de Bioinformática do IGC A informação de todos os seres vivos transmite-se através do ADN A célula é feita sobretudo de

Leia mais

ALINHAMENTO DE SEQUÊNCIAS

ALINHAMENTO DE SEQUÊNCIAS Disciplina de BIOLOGIA COMPUTACIONAL Mestrado em ENGENHARIA BIOMÉDICA 4º Ano, 1º Semestre 2007/08 ALINHAMENTO DE SEQUÊNCIAS Relatório 2 Ana Calhau Ângela Pisco Nuno Santos 54605 55748 55746 Palavras-Chave:

Leia mais

Gene de um organismo Eukariota. Intrões. Codão STOP UTR 5 3. Codão ATG. Exões. Transcrição. 5 Cap 3 poly-a. Splicing. Proteína 3/17/2005 3

Gene de um organismo Eukariota. Intrões. Codão STOP UTR 5 3. Codão ATG. Exões. Transcrição. 5 Cap 3 poly-a. Splicing. Proteína 3/17/2005 3 lgoritmos para a Detecção de Promotores otores em Sequências de DN na eresa Freitas INES-ID/IS ID/IS 3/17/5 1 omo analisar todos estes dados? 3/17/5 1 ene de um organismo Eukariota SS Região promotora

Leia mais

ANÁLISE DOS RESÍDUOS. Na análise de regressão linear, assumimos que os erros E 1, E 2,, E n satisfazem os seguintes pressupostos:

ANÁLISE DOS RESÍDUOS. Na análise de regressão linear, assumimos que os erros E 1, E 2,, E n satisfazem os seguintes pressupostos: ANÁLISE DOS RESÍDUOS Na análise de regressão linear, assumimos que os erros E 1, E 2,, E n satisfazem os seguintes pressupostos: seguem uma distribuição normal; têm média zero; têm variância σ 2 constante

Leia mais

TITULO: Implementação do alinhamento de proteínas em GPU utilizando OpenCL PROPOSTA DE TRABALHO DE GRADUAÇÃO

TITULO: Implementação do alinhamento de proteínas em GPU utilizando OpenCL PROPOSTA DE TRABALHO DE GRADUAÇÃO 1 U NIVERSIDADE FEDERAL DE PERNAMBUCO GRADUAÇÃO EM ENGENHARIA DA COMPUTAÇÃO CENTRO DE INFORMÁTICA 2 0 1 6. 1 TITULO: Implementação do alinhamento de proteínas em GPU utilizando OpenCL PROPOSTA DE TRABALHO

Leia mais

Enunciado de Prova Escrita de Avaliação Sumativa

Enunciado de Prova Escrita de Avaliação Sumativa Enunciado de Prova Escrita de Avaliação Sumativa Ano Lectivo: 2007/200 Disciplina: Biologia e Geologia (ano 2) Ano: 11º Turma: CT Curso: C.H. - C.T. Duração: 0 min. Data: 31 / /2007 Docente: Catarina Reis

Leia mais

Redução de ruído e Interpolação

Redução de ruído e Interpolação Redução de ruído e Interpolação 18 de Maio de 2010 Joana Nunes Nº 58497 Grupo 10 João Marques Nº 58513 Processamento Digital de Sinais Engenharia Biomédica 2º Semestre 2009/2010 1. Visualização do sinal

Leia mais

Análise de Regressão Linear Simples e

Análise de Regressão Linear Simples e Análise de Regressão Linear Simples e Múltipla Carla Henriques Departamento de Matemática Escola Superior de Tecnologia de Viseu Introdução A análise de regressão estuda o relacionamento entre uma variável

Leia mais

PCC104 - Projeto e Análise de Algoritmos

PCC104 - Projeto e Análise de Algoritmos PCC104 - Projeto e Análise de Algoritmos Marco Antonio M. Carvalho Departamento de Computação Instituto de Ciências Exatas e Biológicas Universidade Federal de Ouro Preto 1 de novembro de 2018 Marco Antonio

Leia mais

Tópicos Especiais em Inteligência Artificial COS746. Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro

Tópicos Especiais em Inteligência Artificial COS746. Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro Tópicos Especiais em Inteligência Artificial COS746 Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro Agradecimento Copiado dos slides de Mark Craven para BMI/CS 576, UW-Madison

Leia mais

Principais algoritmos de alinhamento de sequências genéticas. Alexandre dos Santos Cristino

Principais algoritmos de alinhamento de sequências genéticas. Alexandre dos Santos Cristino Principais algoritmos de alinhamento de sequências genéticas Alexandre dos Santos Cristino http://www.ime.usp.br/~alexsc e-mail: alexsc@ime.usp.br Definição de alinhamento de sequências Comparação de duas

Leia mais

Amostragem e distribuições por amostragem

Amostragem e distribuições por amostragem Amostragem e distribuições por amostragem Carla Henriques e Nuno Bastos Departamento de Matemática Escola Superior de Tecnologia de Viseu Contabilidade e Administração População, amostra e inferência estatística

Leia mais

374_ABIN_DISC_011_01 CESPE CEBRASPE ABIN Aplicação: 2018 PROVA DISCURSIVA

374_ABIN_DISC_011_01 CESPE CEBRASPE ABIN Aplicação: 2018 PROVA DISCURSIVA PROVA DISCURSIVA Nesta prova, faça o que se pede, usando, caso deseje, os espaços para rascunho indicados no presente caderno. Em seguida, transcreva os textos para o CADERNO DE TEXTOS DEFINITIVOS DA PROVA

Leia mais

Delineamento e Análise Experimental Aula 4

Delineamento e Análise Experimental Aula 4 Aula 4 Castro Soares de Oliveira ANOVA Significativa Quando a aplicação da análise de variância conduz à rejeição da hipótese nula, temos evidência de que existem diferenças entre as médias populacionais.

Leia mais

Bioinformática. Licenciaturas em Biologia, Bioquímica, Biotecnologia, Engenharia Biológica. João Varela

Bioinformática. Licenciaturas em Biologia, Bioquímica, Biotecnologia, Engenharia Biológica. João Varela Bioinformática Licenciaturas em Biologia, Bioquímica, Biotecnologia, Engenharia Biológica João Varela jvarela@ualg.pt Docentes João Varela (bioinformática: conceitos, bases de dados, aplicações, pesquisa

Leia mais

Alinhamento de seqüências

Alinhamento de seqüências Alinhamento de seqüências Qual a importância do alinhamento de seqüências Permite estabelecer identidades entre sequências Permite a dedução de função de proteínas baseado em similaridade Permite a definição

Leia mais

Tópicos Especiais em Inteligência Artificial COS746. Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro

Tópicos Especiais em Inteligência Artificial COS746. Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro Tópicos Especiais em Inteligência Artificial COS746 Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro Agradecimento Copiado dos slides de Mark Craven/C. David Page para BMI/CS 576,

Leia mais

ANOVA FACTORIAL EXEMPLO 1. ANOVA TWO-WAY COM O SPSS. a capacidade de reconhecimento do odor materno

ANOVA FACTORIAL EXEMPLO 1. ANOVA TWO-WAY COM O SPSS. a capacidade de reconhecimento do odor materno ANOVA FACTORIAL Quando a variável dependente é influenciada por mais do que uma variável independente (Factor) estamos interessados em estudar o efeito não só de cada um dos factores mas e também a possível

Leia mais

i j i i Y X X X i j i i i

i j i i Y X X X i j i i i Mario de Andrade Lira Junior lira.pro.br\wordpress lira.pro.br\wordpress Diferença Regressão - equação ligando duas ou mais variáveis Correlação medida do grau de ligação entre duas variáveis Usos Regressão

Leia mais

Televisão Digital 5ºano 2006/2007. Compressão/Descompressão de Imagens JPEG. Trabalho realizado por: Carla Neves, nº

Televisão Digital 5ºano 2006/2007. Compressão/Descompressão de Imagens JPEG. Trabalho realizado por: Carla Neves, nº Televisão Digital 5ºano 2006/2007 Compressão/Descompressão de Imagens JPEG Trabalho realizado por: Carla Neves, nº010503162 Índice Índice... pág2 Introdução... pág.3 Objectivos... pág.5 Implementação...

Leia mais

Gestão de Stocks. Estudo realizado por: Dulce Varandas e Lídia Teixeira. Orientação:

Gestão de Stocks. Estudo realizado por: Dulce Varandas e Lídia Teixeira. Orientação: Implementação de um Sistema de Gestão Empresarial (ERP) numa empresa do sector metalúrgico Gestão de Stocks Estudo realizado por: Orientação: Dulce Varandas e Lídia Teixeira Prof. Jorge Pinho de Sousa

Leia mais

P E R N AMBUCO UMA FERRAMENTA WEB PARA INFERÊNCIA DE HAPLÓTIPOS PROPOSTA DE TRABALHO DE GRADUAÇÃO

P E R N AMBUCO UMA FERRAMENTA WEB PARA INFERÊNCIA DE HAPLÓTIPOS PROPOSTA DE TRABALHO DE GRADUAÇÃO U NIVERSIDADE FEDERAL DE P E R N AMBUCO GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO CENTRO DE INFORMÁTICA UMA FERRAMENTA WEB PARA INFERÊNCIA DE HAPLÓTIPOS PROPOSTA DE TRABALHO DE GRADUAÇÃO Aluno Ranieri Valença

Leia mais

Pesquisa: operação elementar

Pesquisa: operação elementar Pesquisa: operação elementar uma das operações mais usadas em programação pesquisas em: vectores, matrizes, tabelas de registos, ficheiros, tipos de dados estruturados (hierarquicos),... necessidade de

Leia mais

Estatística Computacional (Licenciatura em Matemática) Duração: 2h Exame 14/06/10 NOME:

Estatística Computacional (Licenciatura em Matemática) Duração: 2h Exame 14/06/10 NOME: DEPARTAMENTO DE MATEMÁTICA DA UNIVERSIDADE DE COIMBRA Estatística Computacional (Licenciatura em Matemática) Duração: 2h Exame 14/06/10 NOME: Observação: A resolução completa das perguntas inclui a justificação

Leia mais

Identificação de Padrões em Proteínas Utilizando a Ferramenta de Bioinformática CD- Search

Identificação de Padrões em Proteínas Utilizando a Ferramenta de Bioinformática CD- Search 4ª Jornada Científica e Tecnológica e 1º Simpósio de Pós-Graduação do IFSULDEMINAS 16, 17 e 18 de outubro de 2012, Muzambinho MG Identificação de Padrões em Proteínas Utilizando a Ferramenta de Bioinformática

Leia mais

Transcritômica. João Carlos Setubal IQ/USP outubro de 2013

Transcritômica. João Carlos Setubal IQ/USP outubro de 2013 Transcritômica João Carlos Setubal IQ/USP outubro de 2013 Objetivo Obter, analisar, e interpretar dados de expressão gênica mrnas (que vão virar proteína) RNAs (que não vão virar proteína; ncrnas) O gene

Leia mais

Identificação de fatores de transcrição a partir de dados de expressão.

Identificação de fatores de transcrição a partir de dados de expressão. Identificação de fatores de transcrição a partir de dados de expressão. Márcio Augusto Afonso de Almeida Laboratório de Genética e Cardiologia Molecular InCor. Introdução Técnicas de expressão global permitem

Leia mais

Exemplo de Aplicação de Algoritmos Genéticos. Prof. Juan Moisés Mauricio Villanueva cear.ufpb.br/juan

Exemplo de Aplicação de Algoritmos Genéticos. Prof. Juan Moisés Mauricio Villanueva cear.ufpb.br/juan Exemplo de Aplicação de Algoritmos Genéticos Prof. Juan Moisés Mauricio Villanueva jmauricio@cear.ufpb.br cear.ufpb.br/juan Estrutura do Algoritmo Genético Algoritmo genético Inicio t = 0 inicializar P(t)

Leia mais

PAULO EDUARDO BRANDÃO, PhD DEPARTAMENTO DE MEDICINA VETERINÁRIA PREVENTIVA E SAÚDE ANIMAL FACULDADE DE MEDICINA VETERINÁRIA E ZOOTECNIA UNIVERSIDADE

PAULO EDUARDO BRANDÃO, PhD DEPARTAMENTO DE MEDICINA VETERINÁRIA PREVENTIVA E SAÚDE ANIMAL FACULDADE DE MEDICINA VETERINÁRIA E ZOOTECNIA UNIVERSIDADE CONCEITOS EM EPIDEMIOLOGIA E FILOGENIA MOLECULARES PAULO EDUARDO BRANDÃO, PhD DEPARTAMENTO DE MEDICINA VETERINÁRIA PREVENTIVA E SAÚDE ANIMAL FACULDADE DE MEDICINA VETERINÁRIA E ZOOTECNIA UNIVERSIDADE DE

Leia mais

Departamento de Matemática - IST(TP)

Departamento de Matemática - IST(TP) Departamento de Matemática - IST(TP) Secção de Estatística e Aplicações Probabilidades e Estatística LEIC+LERC+LEE 2 o Exame/2 o Teste 2 o Semestre/2 a Época 2007/08 Duração: 3 horas/1 hora e 30 minutos

Leia mais

Capítulo 6 Estatística não-paramétrica

Capítulo 6 Estatística não-paramétrica Capítulo 6 Estatística não-paramétrica Slide 1 Teste de ajustamento do Qui-quadrado Testes de independência e de homogeneidade do Qui-quadrado Testes dos sinais e de Wilcoxon Teste de Mann-Whitney Teste

Leia mais

Representação gráfica dos dados

Representação gráfica dos dados Capítulo 0 Representação gráfica dos dados 0. Escalas 0.. Escala linear 0... Propriedades da escala linear Numa escala linear todas as divisões são iguais. Dito de outra forma, quando se representa uma

Leia mais

Projeto e Análise de Algoritmos

Projeto e Análise de Algoritmos Projeto e Análise de Algoritmos Aula 08 Maior Subsequência Comum (LCS) Edirlei Soares de Lima Problema Subsequência: sequência de caracteres não necessariamente contínuos, retirados

Leia mais

4 C odigos de Huffman 4.1 Arvores de c odigo folhas os internos n ıvel altura Arvore bin aria arvore bin aria ordenada

4 C odigos de Huffman 4.1 Arvores de c odigo folhas os internos n ıvel altura Arvore bin aria arvore bin aria ordenada 4 Códigos de Huffman 4.1 Árvores de código Numa árvore qualquer, os nós que não têm filhos são chamados de folhas e os demais nós são chamados de nós internos. Se um nó de uma árvore é filho de outro,

Leia mais

Princípios de Sistemática Molecular

Princípios de Sistemática Molecular ! Ciências teóricas e sistemática biológica "! DNA, genes, código genético e mutação! Alinhamento de seqüências! Mudanças evolutivas em seqüências de nucleotídeos! Otimização em espaços contínuos e discretos!

Leia mais

2 Teoria da Informação

2 Teoria da Informação 2 Teoria da Informação Neste capítulo apresentamos alguns conceitos básicos sobre Teoria da Informação que utilizaremos durante este trabalho. 2.1 Alfabeto, texto, letras e caracteres Um alfabeto Σ = (σ

Leia mais

MIDB-OP: um Modelo de Integração de Dados Biológicos apoiado em Ontologias e Procedência de dados Caroline Beatriz Perlin

MIDB-OP: um Modelo de Integração de Dados Biológicos apoiado em Ontologias e Procedência de dados Caroline Beatriz Perlin MIDB-OP: um Modelo de Integração de Dados Biológicos apoiado em Ontologias e Procedência de dados Caroline Beatriz Perlin Orientador: Prof. Dr. Ricardo Rodrigues Ciferri Agenda Introdução Bancos de dados

Leia mais

Ácidos nucleicos (DNA e RNA) e os genes

Ácidos nucleicos (DNA e RNA) e os genes Disciplina: Biologia Humana Profa. Me. Vivian C. Langiano Ácidos nucleicos (DNA e RNA) e os genes De Robertis, E. Bases da Biologia Celular e Molecular. Rio de Janeiro, Guanabara Koogan, 4 ed. 2006. cap

Leia mais

Compressão Sem Perdas: Codificações Huffman e Aritmética. Adelar da Silva Queiróz Marcelo Teixeira Thiago da Silva Sodré

Compressão Sem Perdas: Codificações Huffman e Aritmética. Adelar da Silva Queiróz Marcelo Teixeira Thiago da Silva Sodré Compressão Sem Perdas: Codificações Huffman e Aritmética Adelar da Silva Queiróz Marcelo Teixeira Thiago da Silva Sodré Compressão Sem Perdas (Lossless Data Compression) Refere-se a métodos de compressão

Leia mais

Métodos Numéricos e Estatísticos Parte II-Métodos Estatísticos

Métodos Numéricos e Estatísticos Parte II-Métodos Estatísticos Métodos Numéricos e Estatísticos Parte II-Métodos Estatísticos Lic. Eng. Biomédica e Bioengenharia-2009/2010 Modelos de regressão É usual estarmos interessados em estabelecer uma relação entre uma variável

Leia mais

MATRIZ DA PROVA DE EXAME

MATRIZ DA PROVA DE EXAME MATRIZ DA PROVA DE EXAME (AVALIAÇÃO DO REGIME NÃO PRESENCIAL E AVALIAÇÃO DE RECURSO) MATEMÁTICA APLICADA ÀS CIÊNCIAS SOCIAIS - 11º ANO Módulos 4, 5 e 6 Duração da Prova 135 minutos Modalidade: Prova escrita

Leia mais

ANÁLISE DE COMPLEXIDADE DOS ALGORITMOS

ANÁLISE DE COMPLEXIDADE DOS ALGORITMOS 1/18 ANÁLISE DE COMPLEXIDADE DOS ALGORITMOS Algoritmos 2/18 Algoritmos Algoritmo - sequência de instruções necessárias para a resolução de um problema bem formulado (passíveis de implementação em computador)

Leia mais

Probabilidades e Estatística LEE, LEIC-A, LEIC-T, LEMat, LERC, MEBiol, MEBiom, MEEC, MEFT, MEMec, MEQ

Probabilidades e Estatística LEE, LEIC-A, LEIC-T, LEMat, LERC, MEBiol, MEBiom, MEEC, MEFT, MEMec, MEQ Duração: 90 minutos Grupo I Probabilidades e Estatística LEE, LEIC-A, LEIC-T, LEMat, LERC, MEBiol, MEBiom, MEEC, MEFT, MEMec, MEQ Justifique convenientemente todas as respostas 1 o semestre 2017/2018 18/11/2017

Leia mais

Guião Exploração do portal INE Divisões Territoriais

Guião Exploração do portal INE Divisões Territoriais Introdução Guião Exploração do portal INE Divisões Territoriais O portal do Instituto Nacional de Estatística (INE) tem disponível um conjunto de recursos para o apoio aos trabalhos de Geografia, nomeadamente

Leia mais

Alinhamentos de Múltiplas Seqüências. Rogério T. Brito Orientador: José A. R. Soares

Alinhamentos de Múltiplas Seqüências. Rogério T. Brito Orientador: José A. R. Soares 1 Alinhamentos de Múltiplas Seqüências Rogério T. Brito Orientador: José A. R. Soares 2 Motivação Problema em Biologia: saber qual é o grau de parentesco entre um conjunto de espécies (construção de árvores

Leia mais

Análise de significância de. alinhamentos

Análise de significância de. alinhamentos Análise de significância de alinhamentos Análise de significância de um alinhamento Tão importante como escolher o método de scoring ou encontrar o alinhamento que maximiza o score é saber avaliar a significância

Leia mais

Intervalos de Confiança

Intervalos de Confiança Intervalos de Confiança Carla Henriques e Nuno Bastos Departamento de Matemática Escola Superior de Tecnologia de Viseu Carla Henriques e Nuno Bastos (DepMAT) Intervalos de Confiança 2010/2011 1 / 33 Introdução

Leia mais

2º Laboratório de Sistemas e Sinais (LEIC Alameda 2008/09)

2º Laboratório de Sistemas e Sinais (LEIC Alameda 2008/09) 2º Laboratório de Sistemas e Sinais (LEIC Alameda 2008/09) Data de realização e de entrega: aula das semanas 6-17/Abril /2009. Local da realização: Laboratório de Controlo, Automação e Robótica, localizado

Leia mais

Otimização Combinatória - Parte 4

Otimização Combinatória - Parte 4 Graduação em Matemática Industrial Otimização Combinatória - Parte 4 Prof. Thiago Alves de Queiroz Departamento de Matemática - CAC/UFG 2/2014 Thiago Queiroz (DM) Parte 4 2/2014 1 / 33 Complexidade Computacional

Leia mais

Problemas de Fluxo em Redes

Problemas de Fluxo em Redes CAPÍTULO 7 1. Conceitos fundamentais de grafos Em muitos problemas que nos surgem, a forma mais simples de o descrever, é representá-lo em forma de grafo, uma vez que um grafo oferece uma representação

Leia mais

Sistemas discretos sem memória e codificação da fonte

Sistemas discretos sem memória e codificação da fonte Sistemas discretos sem memória e codificação da fonte Luis Henrique Assumpção Lolis 10 de setembro de 2013 Luis Henrique Assumpção Lolis Sistemas discretos sem memória e codificação da fonte 1 Conteúdo

Leia mais

IDENTIFICAÇÃO ESTRUTURAL EM REDES DE PROTEÍNAS

IDENTIFICAÇÃO ESTRUTURAL EM REDES DE PROTEÍNAS IDENTIFICAÇÃO ESTRUTURAL EM REDES DE PROTEÍNAS Tópicos Especiais em Redes Complexas II Professor: Daniel Ratton Figueiredo Aluno: Vitor Borges Coutinho da Silva Artigos Comparative Analysis of Protein

Leia mais

Uma Avaliação do Erro Tipo II no Uso do Teste t-student

Uma Avaliação do Erro Tipo II no Uso do Teste t-student Uma Avaliação do Erro Tipo II no Uso do Teste t-student Cleber Giugioli Carrasco Thiago Santana Lemes 1 Unidade Universitária de Ciências Exatas e Tecnológicas, Universidade Estadual de Goiás, UnUCET/UEG,

Leia mais

Livro Interactivo 3D Permite Fazer Anotações e Imprimir. Dúvidas Mais Comuns BIO 11. Flipping Book.

Livro Interactivo 3D Permite Fazer Anotações e Imprimir. Dúvidas Mais Comuns BIO 11. Flipping Book. Livro Interactivo 3D Permite Fazer Anotações e Imprimir Dúvidas Mais Comuns BIO 11 Flipping Book http://netxplica.com DÚVIDAS MAIS COMUNS :: BIOLOGIA E GEOLOGIA 11 http://netxplica.com 1. Crescimento e

Leia mais

Capítulo 6 - Equações Não-Lineares

Capítulo 6 - Equações Não-Lineares Sistemas de Capítulo 6 - Carlos Balsa balsa@ipb.pt Departamento de Matemática Escola Superior de Tecnologia e Gestão de Bragança 2 o Ano - Eng. Civil e Electrotécnica Carlos Balsa Métodos Numéricos 1/

Leia mais

Nuno Miguel Duarte Sequeira André VARIABLE NEIGHBOURHOOD SEARCH

Nuno Miguel Duarte Sequeira André VARIABLE NEIGHBOURHOOD SEARCH Nuno Miguel Duarte Sequeira André VARIABLE NEIGHBOURHOOD SEARCH Optimization and decision support techniques PDEEC 2007 Introdução A meta-heurística VNS (Variable Neighbourhood Search) é bastante recente

Leia mais

6 Estudos de Casos Porta Lógica OU de 4 Entradas

6 Estudos de Casos Porta Lógica OU de 4 Entradas 6 Estudos de Casos Com o objetivo de avaliar a síntese automática de circuitos de QCA usando técnicas de Hardware Evolucionário (EHW), alguns circuitos foram sintetizados e serão apresentados a seguir.

Leia mais

Capítulo 6 Estatística não-paramétrica

Capítulo 6 Estatística não-paramétrica Capítulo 6 Estatística não-paramétrica Slide 1 Teste de ajustamento do Qui-quadrado Testes de independência e de homogeneidade do Qui-quadrado Algumas considerações Slide 2 As secções deste capítulo referem-se

Leia mais

2284-ELE/5, 3316-IE/3

2284-ELE/5, 3316-IE/3 INTELIGÊNCIA ARTIFICIAL 2284-ELE/5, 3316-IE/3 Universidade da Beira Interior, Departamento de Informática Hugo Pedro Proença, 2007/2008 Aprendizagem Supervisionada 2 Os vários algoritmos de Aprendizagem

Leia mais

Análise de dados provenientes de técnicas moleculares

Análise de dados provenientes de técnicas moleculares CIIMAR Curso de formação Análise de dados provenientes de técnicas moleculares Formadores: Filipe Pereira e Filipe Lopes Manual do Curso 1 Índice Objetivo Geral do Curso... 3 Público-alvo... 3 Objetivos

Leia mais

Modelos matemáticos para resolução de problemas de afectação de operações a recursos produtivos

Modelos matemáticos para resolução de problemas de afectação de operações a recursos produtivos Métodos de Análise de Sistemas Produtivos Modelos matemáticos para resolução de problemas de afectação de operações a recursos produtivos 17 de Maio de 2002 Alunos: Álvaro Magalhães Bernardo Ribeiro João

Leia mais

BIOLOGIA COMPUTACIONAL. by

BIOLOGIA COMPUTACIONAL. by BIOLOGIA COMPUTACIONAL by aplf@tecnico.pt 1. Patho-NGen-Trace. Objetivos: "Our aim is to develop new applications of Next-Generation-Sequencing (NGS) for microbial disease surveillance and early warning

Leia mais

7. Introdução à Complexidade de Algoritmos

7. Introdução à Complexidade de Algoritmos 7. Introdução à Complexidade de Algoritmos Fernando Silva DCC-FCUP Estruturas de Dados Fernando Silva (DCC-FCUP) 7. Introdução à Complexidade de Algoritmos Estruturas de Dados 1 / 1 Análise de Algoritmos

Leia mais

Estudo da diversidade com sequências de DNA

Estudo da diversidade com sequências de DNA Estudo da diversidade com sequências de DNA estudo do DNA por sequenciação extracção de DNA PCR do fragmento desejado sequenciação estudo do DNA por sequenciação sequenciação 1 2 3 indivíduo A indivíduo

Leia mais

i j i i Y X X X i j 1 i 2 i i

i j i i Y X X X i j 1 i 2 i i Mario de Andrade Lira Junior lira.pro.br\wordpress lira.pro.br\wordpress Diferença Regressão - equação ligando duas ou mais variáveis Correlação medida do grau de ligação entre duas variáveis Usos Regressão

Leia mais

Tabelas de Hash MBB. Novembro de Algoritmos e Complexidade LEI-LCC

Tabelas de Hash MBB. Novembro de Algoritmos e Complexidade LEI-LCC Tabelas de Hash Algoritmos e Complexidade LEI-LCC 2010-2011 MBB Novembro de 2010 Tabelas e Acesso a Informação As estruturas de dados apresentadas anteriormente têm como objectivo o armazenamento de informação,

Leia mais

TEÓRICA 8 DOCENTES: Prof. Helena Galvão (responsável componente teórico) Prof. Margarida Reis (componente prático)

TEÓRICA 8 DOCENTES: Prof. Helena Galvão (responsável componente teórico) Prof. Margarida Reis (componente prático) TEÓRICA 8 DOCENTES: Prof. Helena Galvão (responsável componente teórico) Prof. Margarida Reis (componente prático) GENÉTICA BACTERIANA Conceitos e Definições Definição bioquímica de gene: segmento de ADN

Leia mais

Sociedade, Tecnologia e Ciência. DR1 - O Elemento, Graça Mendonça. Núcleo Gerador 7 DNA

Sociedade, Tecnologia e Ciência. DR1 - O Elemento, Graça Mendonça. Núcleo Gerador 7 DNA DNA Trabalho realizado por: Rafael Lourenço Fábio Rodrigues Miguel Almeida Rodrigo Sambento 1 á g i n a Índice INTRODUÇÃO... 3 DNA... 4 Organização do DNA na célula... 4 Elementos básicos dos ácidos nucleicos...

Leia mais

Transcrição em Eucariotos. Prof. Doutor Júlio César Borges Disciplina: Bioquímica II Lenita P. Altoé Paula B. Perroni Rhaissa M.

Transcrição em Eucariotos. Prof. Doutor Júlio César Borges Disciplina: Bioquímica II Lenita P. Altoé Paula B. Perroni Rhaissa M. Transcrição em Eucariotos Prof. Doutor Júlio César Borges Disciplina: Bioquímica II Lenita P. Altoé Paula B. Perroni Rhaissa M. Bontempi _sumário _sumário Transcrição Dogma central Considerações iniciais

Leia mais

Máquinas Elétricas. Máquinas CC Parte IV

Máquinas Elétricas. Máquinas CC Parte IV Máquinas Elétricas Máquinas CC Parte IV Máquina CC eficiência Máquina CC perdas elétricas (perdas por efeito Joule) Máquina CC perdas nas escovas Máquina CC outras perdas a considerar Máquina CC considerações

Leia mais

Manual de Utilizador

Manual de Utilizador Manual de Utilizador Introdução Este manual de utilizador tem por objectivo a introdução ao programa de gestão de um campeonato de voleibol aos seus utilizadores. Para isso, a informação será organizada

Leia mais

Modelos Evolucionários e Tratamento de Incertezas

Modelos Evolucionários e Tratamento de Incertezas Ciência da Computação Modelos Evolucionários e Tratamento de Incertezas Aula 01 Computação Evolucionária Max Pereira Motivação Se há uma multiplicidade impressionante de algoritmos para solução de problemas,

Leia mais

Plano. Aspectos Relevantes de HMMs. Teoria de HMMs. Introdução aos Modelos Escondidos de Markov

Plano. Aspectos Relevantes de HMMs. Teoria de HMMs. Introdução aos Modelos Escondidos de Markov Plano Esta apresentação é para pessoas sem conhecimento prévio de HMMs Introdução aos Modelos Escondidos de Markov 2004 Objetivos: Ensinar alguma coisa, não tudo (Visão geral, sem muitos detalhes). Tentar

Leia mais

Capítulo 4 Inferência Estatística

Capítulo 4 Inferência Estatística Capítulo 4 Inferência Estatística Slide 1 Resenha Intervalo de Confiança para uma proporção Intervalo de Confiança para o valor médio de uma variável aleatória Intervalo de Confiança para a diferença de

Leia mais

Alinhamento local- Utilização do BLAST

Alinhamento local- Utilização do BLAST Alinhamento local- Utilização do BLAST BLAST Tipos de BLAST (blastn) Compara nucleotídeos (blastp) Compara proteínas Utiliza nucleotídeo como query, este é traduzido nos seus 6 quadros de leitura e é comparado

Leia mais

Estatística Indutiva

Estatística Indutiva Estatística Indutiva MÓDULO 7: INTERVALOS DE CONFIANÇA 7.1 Conceitos básicos 7.1.1 Parâmetro e estatística Parâmetro é a descrição numérica de uma característica da população. Estatística é a descrição

Leia mais

Problemas de otimização

Problemas de otimização Problemas de otimização Problemas de decisão: Existe uma solução satisfazendo certa propriedade? Resultado: sim ou não Problemas de otimização: Entre todas as soluções satisfazendo determinada propriedade,

Leia mais

Programa de Pós-Graduação Stricto Sensu em Biologia Computacional e Sistemas. Seleção de Mestrado 2012-A

Programa de Pós-Graduação Stricto Sensu em Biologia Computacional e Sistemas. Seleção de Mestrado 2012-A Programa de Pós-Graduação Stricto Sensu em Biologia Computacional e Sistemas Seleção de Mestrado 2012-A INSTRUÇÕES (LEIA ATENTAMENTE ANTES DE PREENCHER A PROVA): a. Identifique sua prova unicamente com

Leia mais

MODELOS DE APOIO À DECISÃO Licenciatura em Engenharia e Gestão Industrial Departamento de Engenharia e Gestão, Instituto Superior Técnico

MODELOS DE APOIO À DECISÃO Licenciatura em Engenharia e Gestão Industrial Departamento de Engenharia e Gestão, Instituto Superior Técnico NOME: No. MECANOGRÁFICO: MODELOS DE APOIO À DECISÃO Licenciatura em Engenharia e Gestão Industrial Departamento de Engenharia e Gestão, Instituto Superior Técnico Ano académico 2008/2009 2º Semestre Exame

Leia mais

Apresentação da Unidade Curricular 2010/11

Apresentação da Unidade Curricular 2010/11 Apresentação da Unidade Curricular 2010/11 Objectivos, Programa, Critérios de Avaliação, Bibliografia,... Paulo Fazendeiro Universidade da Beira Interior 1 Conteúdo Objectivos Programa Planeamento Critérios

Leia mais

Cap. 6: Métodos para alinhamento de múltiplas seqüências

Cap. 6: Métodos para alinhamento de múltiplas seqüências Cap. 6: Métodos para alinhamento de múltiplas seqüências Organização O que é um alinhamento múltiplo Escores para alinhamentos múltiplos Relação entre alinhamento múltiplo e análise filogenética Métodos

Leia mais

Qual o nome das bases pirimídicas?. R: Timina e Citosina. Quais os constituintes dos nucleótidos?

Qual o nome das bases pirimídicas?. R: Timina e Citosina. Quais os constituintes dos nucleótidos? O que significam as siglas? R: Ácido desoxirribonucleico. A molécula de tem mensagens codificadas em sequências de que contêm bases púricas e pirimídicas. R: nucleótidos Qual o nome das bases pirimídicas?.

Leia mais

Sumário. Decisões óptimas em jogos (minimax) Cortes α-β Decisões imperfeitas em tempo real

Sumário. Decisões óptimas em jogos (minimax) Cortes α-β Decisões imperfeitas em tempo real Jogos Capítulo 6 Sumário Decisões óptimas em jogos (minimax) Cortes α-β Decisões imperfeitas em tempo real Jogos vs. Problemas de Procura Adversário imprevisível" necessidade de tomar em consideração todas

Leia mais

TESTE DE COMPARAÇÃO MÚLTIPLA

TESTE DE COMPARAÇÃO MÚLTIPLA SUMÁRIO 1 TESTE DE COMPARAÇÃO MÚLTIPLA Quando a aplicação da análise de variância conduz à rejeição da hipótese nula, temos evidência de que existem diferenças entre as médias populacionais. Mas, entre

Leia mais

5 Resultados Figura 5.1 ENA Sudeste/Centro-Oeste Figura 5.2 ENA Sul

5 Resultados Figura 5.1 ENA Sudeste/Centro-Oeste Figura 5.2 ENA Sul Resultados Neste capítulo são apresentados os resultados obtidos. A metodologia definida foi aplicada às séries de ENAs dos quatro subsistemas brasileiros. Como dito anteriormente, as ENAs são computadas

Leia mais

Ferramentas Web, Web 2.0 e Software Livre em EVT

Ferramentas Web, Web 2.0 e Software Livre em EVT E s t u d o s o b r e a i n t e g r a ç ã o d e f e r r a m e n t a s d i g i t a i s n o c u r r í c u l o d a d i s c i p l i n a d e E d u c a ç ã o V i s u a l e T e c n o l ó g i c a Bitmap Font Writer

Leia mais

PROVA ESCRITA DESTINADA A AVALIAR A CAPACIDADE PARA A FREQUÊNCIA DO ENSINO SUPERIOR DOS MAIORES DE 23 ANOS

PROVA ESCRITA DESTINADA A AVALIAR A CAPACIDADE PARA A FREQUÊNCIA DO ENSINO SUPERIOR DOS MAIORES DE 23 ANOS ESCOLA SUPERIOR AGRÁRIA Instituto Politécnico de Coimbra 2014 PROVA ESCRITA DESTINADA A AVALIAR A CAPACIDADE PARA A FREQUÊNCIA DO ENSINO SUPERIOR DOS MAIORES DE 23 ANOS DATA 05/05/2014 HORA 10.00H - 12.00H

Leia mais

PREFERÊNCIA DO CONSUMIDOR: UM ESTUDO DE CASO COM APLICAÇÃO DE ANÁLISE CONJUNTA E MODELOS DE REGRESSÃO

PREFERÊNCIA DO CONSUMIDOR: UM ESTUDO DE CASO COM APLICAÇÃO DE ANÁLISE CONJUNTA E MODELOS DE REGRESSÃO PREFERÊNCIA DO CONSUMIDOR: UM ESTUDO DE CASO COM APLICAÇÃO DE ANÁLISE CONJUNTA E MODELOS DE REGRESSÃO Gustavo Rocha Aquino González 1 Ana Paula Barbosa Sobral 2 Jane Azevedo da Silva 3 Raquel Campanate

Leia mais

BIOLOGIA. Moléculas, Células e Tecidos Transcrição e Tradução. Prof. Daniele Duó

BIOLOGIA. Moléculas, Células e Tecidos Transcrição e Tradução. Prof. Daniele Duó BIOLOGIA Moléculas, Células e Tecidos Prof. Daniele Duó O código genético É a relação entre a sequência de bases no DNA e a sequência correspondente de aminoácidos, na proteína; Guarda toda informação

Leia mais

Sumário. A Transcrição do DNA

Sumário. A Transcrição do DNA Sumário A Transcrição do DNA A expressão dos genes: do DNA à proteína. Unidade transcricional. RNA: estrutura química e estrutura secundária. Transcrição do DNA: o enzima RNA polimerase. Fases da transcrição.

Leia mais

Manual de Funcionamento do Programa de Interface

Manual de Funcionamento do Programa de Interface ANEXOS Manual de Funcionamento do Programa de Interface Para a interacção do utilizador com a ferramenta construída foi desenvolvida uma aplicação que tem como função de auxiliar a tomada de decisão. Este

Leia mais

3 Algoritmos Genéticos

3 Algoritmos Genéticos Técnicas de Inteligência Computacional 33 3 Algoritmos Genéticos Este capítulo resume os principais conceitos sobre o algoritmo evolucionário empregado nesta dissertação. É apresentada uma breve explicação

Leia mais

Protein Homology detection by HMM-comparation.

Protein Homology detection by HMM-comparation. UNIVERSIDADE FEDERAL DE PERNAMBUCO Cin Centro de Informática Pós-Graduação em Ciência da Computação Protein Homology detection by HMM-comparation. Johannes Soding Vol. 21 no. 7 2005, BIOINFORMATICS Recife,

Leia mais