Prova de Admissão do Programa Inter-unidades em Bioinformática. 17 de Novembro de NOME:

Documentos relacionados
a) Baseando-se nos resultados acima, qual é a sequência mais provável desses 4 genes no cromossomo, a partir do gene A? b) Justifique sua resposta.

DOGMA CENTRAL DA BIOLOGIA MOLECULAR

UNIVERSIDADE FEDERAL DE OURO PRETO INSTITUTO DE CIÊNCIAS EXATAS E BIOLÓGICAS DEPARTAMENTO DE CIÊNCIAS BIOLÓGICAS

Profa. Dra. Viviane Nogaroto

Transcrição do DNA. Dogma central. O fluxo da informação é unidirecional. Refutação definitiva da herança dos caracteres adquiridos 26/04/2015

CAPÍTULO 6: COMPOSTOS ORGÂNICOS PROTEÍNAS CAP. 7: COMPOSTOS ORGÂNICOS ÁCIDOS NUCLEICOS E VITAMINAS

Departamento de Genética Nilce M. Martinez Rossi

genética molecular genética clássica DNA RNA polipeptídio GENÉTICA Exercícios 1. Julgue os itens que se seguem.

Transcrição: Síntese de RNA Tradução: Síntese Proteica

Universidade Federal do Espírito Santo Centro de Ciências Agrárias. Disciplina BIOLOGIA MOLECULAR

EXERCÍCIOS DE MONITORIA 2º PERÍODO AGOSTO BIOLOGIA RECUP. PARCIAL

((lambda (h q) (list h (list q h) (list q q))) (quote (lambda (h q) (list h (list q h) (list q q)))) (quote quote))

Transcrição é a primeira etapa da expressão do gene. Envolve a cópia da sequência de DNA de um gene para produzir uma molécula de RNA

AU10. Princípios Básicos de Genética Molecular 2: Regulação da Expressão Gênica. Juliana da Silveira Schauren

Anabolismo Nuclear e Divisão Celular

Duplicação do DNA & Síntese de proteínas

Prof. João Carlos Setubal

MECANISMOS GENÉTICOS BÁSICOS: DO DNA À PROTEINA

Número de genes versus número de proteínas em eucariotos

GOIÂNIA, / / PROFESSOR: FreD. DISCIPLINA: Biologia SÉRIE: 1º. ALUNO(a):

IFSC Campus Lages. Transcrição. Biologia Molecular Prof. Silmar Primieri

Aula 2. Replicação, Transcrição, Tradução e Regulação

Perguntas para o roteiro de aula. 1) Descreva as principais características estruturais gerais das moléculas de DNA e

Exercícios: Árvores. Universidade Federal de Uberlândia - UFU Faculdade de Computação - FACOM Lista de exercícios de estrutura de dados em linguagem C

Estágio Docência. Vanessa Veltrini Abril Doutoranda em. Março de 2007

Lista de Exercícios - Monitorias

ESTRUTURA E FUNÇÃO DOS GENES E CROMOSSOMOS

Prof. Marcelo Langer. Curso de Biologia. Aula 26 Genética

Síntese de Proteínas e Divisão Celular

CAP Exame de Admissão 16/12/2013. Instruções Gerais (leia atentamente)

Introdução à Bioquímica

INF1010 Lista de Exercícios 2

Nome: Curso: Nº. 1 º Teste Engenharia Genética 22 de Novembro de 2012 Duração: 2h.

Linguagens Regulares. Prof. Daniel Oliveira

DNA RNA Proteínas. Organização estrutural e funcional do núcleo 04/04/2017. Processamento (Splicing) Tradução (citoplasma) Replicação.

Bases e aplicações. da tecnologia do DNA recombinante

DNA: Replicação e Transcrição. Professora: MSc Monyke Lucena

03/02/2010. Estrutura de Ácidos. Nucléicos e. Organização do. Genoma Humano. DNA por Watson & Crick, (Nature 171: ).

EXERCÍCIOS DE VESTIBULAR

Sequenciamento de genoma e transcriptomas

Princípios Básicos de Genética Molecular Parte II. Profª Ana Claudia 17/02/2017

COLÉGIO PEDRO II CAMPUS TIJUCA II. DEPARTAMENTO DE BIOLOGIA E CIÊNCIAS COORD.: PROFa. CRISTIANA LIMONGI

2. EXERCÍCIOS PROPOSTOS SOBRE V.A. E DISTRIB.PROBAB.

REVISÃO: Terceira Unidade Nutrição

Estatística e Probabilidade

Princípios de Sistemática Molecular

Enunciado de Prova Escrita de Avaliação Sumativa

A síntese proteica envolve várias fases, que culminam na síntese de proteínas nos ribossomas, tendo como base a informação genética do DNA. Classifica

PROCESSAMENTO DE RNA. Prof. Marcelo A. Soares. Universidade Federal do Rio de Janeiro

CONHECIMENTOS ESPECÍFICOS

Do DNA à Proteína: Síntese protéica. Profa. Dra. Viviane Nogaroto

Síntese de RNA e Proteínas

Resoluções das atividades

Aula 2 - Revisão DNA RNA - PROTEÍNAS

Organização do genoma e variação individual

ICET CURSO: Ciência da Computação e Sistemas de Informação (Estrutura de Dados) Estudos Disciplinares Campus: Data: / / Nome:

SERVIÇO PÚBLICO FEDERAL UNIVERSIDADE FEDERAL DE GOIÁS CÃMPUS JATAÍ PLANO DE ENSINO

Biologia Ensino Médio 2º ano classe: Prof. Cesinha Nome: nº

Unidade I ESTATÍSTICA APLICADA. Prof. Mauricio Fanno

Sumário. 2 Índice Remissivo 12

Qual o nome das bases pirimídicas?. R: Timina e Citosina. Quais os constituintes dos nucleótidos?

Distribuição Normal. Prof. Eduardo Bezerra. (CEFET/RJ) - BCC - Inferência Estatística. 25 de agosto de 2017

Genética Bacteriana. Julliane Dutra Medeiros

LEMBRANDO O DOGMA CENTRAL DA BIOLOGIA E CONTROLE DA EXPRESSÃO GÊNICA

UNIVERSIDADE FEDERAL DA PARAÍBA. Variáveis Aleatórias. Departamento de Estatística Luiz Medeiros

REVISÃO LEMBRANDO O DOGMA CENTRAL DA BIOLOGIA. Aula 2

Modelos Probabiĺısticos Discretos

Regulação da expressão gênica em Procariotos. John Wiley & Sons, Inc.

Proteínas - I. (Estrutura) Bioquímica Prof. Dr. Marcelo Soares

Processamento de RNA

7 Teste de Hipóteses

Tradução. 3 tipos de RNA estao envolvidos no processo da traducao:

Modelos básicos de distribuição de probabilidade

DEFINIÇÕES EM EPIDEMIOLOGIA MOLECULAR E CONCEITOS BÁSICOS EM BIOLOGIA MOLECULAR

GENOMAS. Prof. Dr. Marcelo Ricardo Vicari

Intervalos de Confiança

Métodos Experimentais em Ciências Mecânicas

MÓDULO 3 BIOLOGIA MOLECULAR

Bioestatística F. Modelo Binomial. Enrico A. Colosimo

IFSC Campus Lages. Tradução. Biologia Molecular Prof. Silmar Primieri

)XQGDPHQWRVGHSUREDELOLGDGHHHVWDWtVWLFD

Variáveis Aleatórias Discretas 1/1

Linguagens Formais. Aula 01 - Conceitos Básicos. Prof. Othon Batista Mestre em Informática

7.012 Conjunto de Problemas 4

1. (Acafe 2016) Cientistas identificam nova mutação genética relacionada à obesidade.

Turma: Engenharia Data: 12/06/2012

CÉLULAS 2/14/2017 FACULDADE EDUCACIONAL DE MEDIANEIRA COMPOSIÇÃO MOLECULAR DAS CÉLULAS COMPOSIÇÃO QUÍMICA DAS CÉLULAS COMPOSIÇÃO MOLECULAR DAS CÉLULAS

Um modelo estocástico para o fluxo de caixa de um plano de previdência de um indivíduo 15

ÁCIDOS NUCLÉICOS ESTRUTURA E FUNÇÕES

TÉCNICAS DE AMOSTRAGEM

21/08/2017 DOGMA DA BIOLOGIA MOLECULAR TRADUÇÃO TRADUÇÃO TRADUÇÃO FACULDADE EDUCACIONAL DE MEDIANEIRA. Profª. Dra. Patrícia Bellon.

Nessa situação, a média dessa distribuição Normal (X ) é igual à média populacional, ou seja:

Distribuição Gaussiana

DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA)

Armazenamento da informação genética

i. f Y (y, θ) = 1/θ... 0 y θ 0... y < 0 ou y > θ Se a amostra selecionada foi ( ), qual será a estimativa para θ?

1 Introdução. 2 Variáveis Aleatórias Discretas (VAD)

VARIÁVEL ALEATÓRIA e DISTRIBUIÇÃO BINOMIAL

Aula 2. ESTATÍSTICA E TEORIA DAS PROBABILIDADES Conceitos Básicos

Dos genes às proteínas

Transcrição:

1 Prova de Admissão do Programa Inter-unidades em Bioinformática 17 de Novembro de 2017. NOME: A prova contém 30 (trinta) questões divididas em 3 (três) áreas do conhecimento (matemática/estatística, ciência da computação, ciências biológicas). Você deverá responder um total de 10 (dez) questões, sendo obrigatoriamente um mínimo de 7 (sete) de uma única área do conhecimento. Caso deseje, você pode responder as 10 (dez) questões de uma área, se preferir, pode também responder 7 (sete) questões de uma área e 3 (três) de outra(s) área(s). Responda cada questão dentro do quadrado correspondente. Respostas fora do quadrado correspondente não serão consideradas. A prova pode ser feita a lápis. Boa prova! Duração: 3 horas

2 Questões da Área de Matemática e Estatística 1. Um pesquisador dispõe de 92 estudantes a serem alocados aleatoriamente aos grupos G1 ou G2. Ele decide lançar uma moeda e, na ocorrência de cara o estudante será alocado a G1, caso contrário a G2. Os seguintes resultados foram obtidos: Número de estudantes G1 35 G2 57 Total 92 a) Com base nesses dados estime a probabilidade π de ocorrência de cara da moeda. b) Obtenha o intervalo de 95% de confiança para π. c) Com base nos resultados você diria que a moeda é honesta (π=0,50)? Justifique. Considere que: P(Z 1,645) = 0,95 e P(Z 1,960) = 0,975, Z variável normal padrão. X~Binomial n, π ; para n grande: p = X π 1 π ~N(π, ) n n

3 2. O intervalo 1,65 ± 0,20 é o intervalo de 95% de confiança construído a partir de uma amostra de tamanho 100, para a média µ M da altura (em metros) de mulheres de uma população. a) Com base nesse intervalo, qual seria a decisão do teste da hipótese H 0 : µ M =1,87 versus H 1 : µ M 1,87? Justifique. b) Suponha que nessa população, as alturas, tanto de homens como de mulheres, sigam uma distribuição normal com desvio padrão igual a 0,80m. Considerando que em uma amostra de 80 homens dessa população foi observada uma média de altura de 1,87m, encontre o intervalo de 95% de confiança para a média populacional µ H da altura (em metros) de homens. c) Há evidência amostral de diferença significante entre as médias de alturas de homens e mulheres? Justifique. Considere que: P(Z 1,645) = 0,95 e P(Z 1,960) = 0,975, Z variável normal padrão.

4 3. Um pesquisador está investigando variáveis associadas com a expressão de um gene. Com essa finalidade, o seguinte modelo foi adotado: y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 1 x 2 + e em que y corresponde à intensidade de expressão do gene, x 1 (=0, 1, 2) representa o número de alelos G em um marcador molecular, x 2 é uma variável indicadora de hipertensão (0=normotenso e 1=hipertenso) e e é um erro aleatório com média zero e variância constante. Indique FALSO ou VERDADEIRO, e justifique, as seguintes afirmações: a) β 0 é a intensidade de expressão esperada do gene, independentemente das demais variáveis. b) β 1 indica a variação esperada na intensidade de expressão correspondente à mudança de uma unidade no número de alelos G, independentemente da outra variável. c) β 3 =0 indica que retas paralelas explicam o efeito de x 1 sobre y para normotensos e hipertensos.

5 4. Em um experimento o pesquisador acompanhou por 30 dias a causa das internações hospitalares (devido à doença A ou à doença B). Ao final desse período o seguinte resultado foi obtido, classificado segundo o gênero do paciente: Gênero Doença A Doença B Total Masculino 150 92 242 Feminino 90 206 296 Total 240 298 538 a) Com base nos dados, qual é a probabilidade de internação devido à doença A de acordo com o gênero do paciente? b) Considere π a probabilidade de um evento ocorrer. A chance do evento é definida como π/(1-π). Com base na amostra obtida, calcule a razão de chances de internação devido à Doença A entre masculinos e femininos. c) Interprete o valor obtido em b).

6 5. Sejam X, Y e Z variáveis aleatórias quaisquer, e a, b, c e d constantes. Responda: a) Quando cor(ax + b, cy + d) = cor(x, Y)? (cor é o operador correlação) b) Quando var(x + Y) = var(x) + var(y)? (var é o operador variância) c) var(x + M X ) é maior, menor ou igual à var(x)? (M X o valor esperado de X)

7 6. Encontre os intervalos de convergência para a representação em série de Taylor de: a) g t = e! b) g t = ln (t)

7. Interprete a solução e dê um exemplo de aplicação da equação diferencial: f ''(t) = -af(t). 8

9 8. Calcule: a) 2 lg 0.1 + 3ln (e! ); lg: logaritmo na base 10, ln: logaritmo na base e b) 2 ln 3e ln (9) 3 ln 5e 3 2 ln (25)

9. Formule o problema tratado em PCA Principal Component Analysis e sua relação com a teoria espectral de matrizes simétricas. 10

11 10. Uma matriz simétrica A é positiva definida se, e somente se, x ʹAx > 0, sendo x um vetor não nulo. Neste caso, a forma quadrática associada à matriz A também é positiva definida. a) Determine a matriz A associada à forma quadrática 2 2 f x, x = 3x + 3x + x x. ( 1 2 ) 1 2 2 1 2 b) Verifique se f ( x 1, x 2 ) é positiva definida.

12 Questões da Área de Ciência da Computação 1. Mostre um autômato finito determinístico que opera sobre o alfabeto Σ = {a,b} e que aceita cadeias do seguinte tipo: um ou mais a s seguido de zero ou mais b s. Por exemplo, as cadeias aaa e aab são aceitas pelo autômato, mas as cadeias bb, bbaa,aabba não são.

2. Qual é o algoritmo mais eficiente para ordenar n números inteiros, supondo que cada número representa a idade de uma pessoa? Esboce o algoritmo e faça sua análise de complexidade. 13

3. Suponha um grafo orientado e ponderado, com pesos não negativos. Sobre um tal grafo podemos imaginar os dois seguintes problemas: (a) achar o caminho mais curto (ou mais leve) de um vértice u a um vértice v; (b) achar o caminho mais longo (ou mais pesado) (sem repetição de vértices) de um vértice u a um vértice v. O peso de um caminho é a soma dos pesos de suas arestas. Pergunta: os dois problemas podem ser resolvidos de forma eficiente? Justifique sua resposta. 14

4. Qual é a técnica que se usa para a análise da complexidade de algoritmos recursivos? Dê um exemplo (de algoritmo recursivo e de aplicação da técnica a ele). 15

5. Dada uma turma T com n alunos e as relações de amizade entre pares de alunos, queremos determinar quantas panelinhas existem na turma. Um aluno X não pertence a uma panelinha P se X não tem relação de amizade com nenhum aluno que pertence a P; do contrário, X pertence a P. Apresente um algoritmo eficiente para determinar as panelinhas de T. As relações de amizade são simétricas: se X é amigo de Y então Y é amigo de X. Você deve considerar que cada aluno é amigo de si mesmo, portanto panelinhas de um único aluno são possíveis. Note que um membro de uma panelinha P não necessariamente é amigo de todos os demais membros de P; basta um. 16

6. Apresente um pseudo-código da função pop(p,x) para uma pilha P. Se a pilha estiver vazia, pop devolve falso. Caso contrário ela devolve verdadeiro, coloca em x o valor do topo da pilha, e atualiza a pilha. Suponha que P é um vetor. 17

7. Apresente uma expressão regular que gera cadeias de 0 s e 1 s em que o número de 0 s consecutivos e o número de 1 s consecutivos é sempre par. Exemplos de cadeias que devem ser geradas: 0011, 11110011, 0000. Exemplos de cadeias que não devem ser geradas: 00011, 11011. Você pode usar apenas os operadores * (repetição de zero ou mais vezes), (alternação entre caracteres), concatenação de caracteres e os parênteses para agrupar caracteres. 18

8. Existem oito sacos sendo que sete delas contêm bolas pesando cinco gramas cada bola e apenas um saco contendo bolas de quatro gramas cada. Você tem a disposição uma balança digital. Descreva uma estratégia para que, com apenas uma pesagem, descubra qual o saco que contém bolas de quatro gramas. Cada saco contém tantas bolas quanto se queira. 19

9. Dada uma árvore binária de busca de inteiros, mostre a estrutura da árvore após cada um dos valores 5, 2, 4, 7, 8, 1, 3 serem inseridos e depois mostre a mudança no resultado da árvore quando 2 é removido. 20

21 10. Para cada uma das afirmações a seguir, responda verdadeiro ou falso. a) O algoritmo de Prim usa Union-find como estrutura de dado. b) No Union-find com compressão de caminho, após realizarmos uma operação de Find-Set(x), a altura da árvore que x está sempre diminui. c) Na melhor implementação possível da estrutura de dado Union-find, o custo no pior caso para cada operação é O(log n). d) Na melhor implementação possível do Union-find, o custo no pior caso para a operação de Make-set é O(1).

22 Questões da Área de Ciências Biológicas 1) O fluxo da informação genética envolve os processos denominados replicação, transcrição e tradução. a) Justifique essa afirmação, indicando o papel de cada um desses processos na transmissão de informação em sistemas biológicos. b) Indique quais as principais moléculas (substratos, produtos e catalizadores) envolvidas em cada um dos processos.

23 2) Como os grupos polares e apolares se distribuem na estrutura terciária de proteínas globulares? A maioria das proteínas globulares são desnaturadas por uma breve exposição a 65 o C, mas algumas delas que possuem resíduos de cisteína em sua cadeia devem ser aquecidas por mais tempo e a temperaturas mais altas para desnaturarem. Qual a base molecular dessa propriedade? Como a desnaturação dessas proteínas com resíduos de cisteína poderia ser facilitada?

24 3) Esquematize a estrutura típica de um gene eucariótico contendo 3 exons. Indique no esquema e explique por escrito a função dos elementos regulatórios mais importantes para: a) o controle da transcrição do DNA b) o processamento do RNA para dar origem ao RNA mensageiro maduro c) o início da tradução da proteína a partir do mrna maduro

4) Explique porque a replicação do DNA é semiconservativa, bidirecional e semidescontínua. 25

5) Os 20 aminoácidos que compõem as proteínas são codificados por 61 códons diferentes. No entanto, apenas 32 RNAs transportadores distintos são suficientes para reconhecer todos os 61 códons e garantir a síntese de proteínas. Explique esse aparente paradoxo utilizando seus conhecimentos sobre o mecanismo de leitura do código genético. 26

6) Qual a diferença entre mutações genéticas e modificações epigenéticas do genoma? Dê um exemplo de um tipo de modificação epigenética frequente e explique o seu papel no controle da expressão gênica. 27

28 7) A sequência de DNA abaixo contem o gene que codifica para a cadeia A da insulina humana. Os códons de início e fim da região codificadora estão sublinhados e em negrito. 5 AGCCCTCCAGGACAGGCTGCATCAGAAGAGGCCATCAAGCAGATCACTGTCCTTCTGCCATGGCCCTGT GGATGCGCCTCCTGCCCCTGCTGGCGCTGCTGGCCCTCTGGGGACCTGACCCAGCCGCAGCCTTTGTGAA CCAACACCTGTGCGGCTCACACCTGGTGGAAGCTCTCTACCTAGTGTGCGGGGAACGAGGCTTCTTCTA CACACCCAAGACCCGCCGGGAGGCAGAGGACCTGCAGGTGGGGCAGGTGGAGCTGGGCGGGGGCCCTGG TGCAGGCAGCCTGCAGCCCTTGGCCCTGGAGGGGTCCCTGCAGAAGCGTGGCATTGTGGAACAATGCTG TACCAGCATCTGCTCCCTCTACCAGCTGGAGAACTACTGCAACTAGACGCAGCCCGCAGGCAGCCCCAC ACCCGCCGCCTCCTGCACCGAGAGAGATGGAATAAAGCCCTTGAACCAGCAAAA 3 a) Forneça a sequência de um par de oligonucleotídeos iniciadores apropriados para a amplificação do gene da insulina. Marque na sequência acima o local de anelamento de cada iniciador. b) Faça um esquema ilustrando a amplificação da região pretendida ao longo do 1º ciclo da PCR. Indique a orientação das fitas de DNA no esquema. c) quantas vezes a quantidade inicial de DNA seria amplificada após 10 ciclos de PCR? d) Que procedimento prévio seria necessário para amplificar o gene da insulina por PCR a partir de RNA isolado de uma linhagem celular?

29 8) Nas duas colunas listadas abaixo há uma série de termos relacionados. Faça a ligação entre os nomes constantes da coluna da esquerda com um único termo na coluna da direita. RNA polimerase vetor primase tradução HindIII RNA mensageiro de eucarioto intron holoenzima 5 cap metilação de RNA mensageiro plasmídeo promotor AUG endonuclease de restrição TATA box splicing Poli A replicação Shine-Dalgarno RNA ribossômico de procarioto

9) Compare a expressão gênica em procariotos e eucariotos quanto ao: a) grau de acoplamento da transcrição e da tradução. b) número de produtos gênicos em um transcrito primário. c) número de proteínas resultantes da tradução de um transcrito primário. d) controle por fatores de transcrição protéicos e) organização de genes em operons. 30

10) Quais são os principais elementos necessários para a transcrição de genes presentes na sequência de DNA de eucariotos? Descreva a função desses elementos e o seu papel no controle da expressão gênica durante a diferenciação e desenvolvimento em organismos multicelulares. 31