Nome da atividade: Identificação de uma proteína a partir da sua seqüência nucleotídica e determinação da sua estrutura e função

Caros Alunos, Para desenvolver a atividade abaixo vocês precisarão de um computador conectado à internet banda larga, do arquivo.txt (bloco de notas) disponível no Constructore e deste arquivo com as coordenadas para o trabalho. Explorar o resultado significa observar o máximo possível de detalhes a partir dos resultados gerados com a ferramenta de trabalho que vocês estão utilizando. Não se preocupem, porque links explicando o princípio e/ou o significado dos termos estarão disponíveis em quase todas as etapas. Vale destacar que as coordenadas descritas abaixo representam apenas uma das milhares de formas de desenvolver esta tarefa. Fiquem completamente à vontade para explorarem outros recursos disponíveis na web. Informações relevantes obtidas por caminhos diferentes dos apresentados poderão favorecer o aprendizado e o rendimento final. Nome da atividade: Identificação de uma proteína a partir da sua seqüência nucleotídica e determinação da sua estrutura e função Seção 1: Identificação da proteína e aquisição de dados Copie a seq do gene de interesse a partir do arquivo fornecido > Entre em http://blast.ncbi.nlm.nih.gov/blast.cgi > link blastx > cole a seq em Enter query sequence > clique em Blast > clicar na identificação (ID) o primeiro item dos resultados (ex.: gb BCD95476.1 ) > explorar os dados disponíveis (qual é a proteína, organismo de origem...copie e guarde tudo!) > na parte superior da página em format escolher FASTA > copie resultado (desde gi BCD95476.1 até o final da seq) > criar um arquivo ovo no bloco de notas (.txt) > colar a seq no arquivo.txt. Esta seq corresponde à seq da proteína codificada pela seq de interesse. Representa a tradução da seq nucleotídica em um seq de aminoácidos. Copie também a seqüência traduzida do gene (proteína) para o advanced search do protein data bank (http://www.rcsb.org/pdb/search/advsearch.do). Escolha o query type, Sequence (BLAST/FASTA/PSI_BLAST). Clique em Result Count e em seguida em submit query. Nesta procura aparecerão proteínas homólogas que já tiveram sua estrutura resolvida. Para recuperar as estruturas clique no pdb e faça o download dos arquivos fasta (sequência primária) e do arquivo pdb (coordenadas estruturais). Use o arquivo fasta para alinhamento de seqüencia e o arquivo pdb para visualização da estrutura.

Usando o resultado do Blast e do PDB > copie outras seqüências (~10) > a menos e a mais homóloga e outras com homologia intermediária > para cada seq copie a origem do organismo e outras informações que acharem necessárias > colar todas as seqs no mesmo arquivo.txt Ao final desta sessão vocês terão: 1) Identificação da proteína 2) Organismo e local de origem 3) um arquivo.txt contendo 10 seq em formato Fasta (o formato Fasta é útil para inserir no Bioedit). Guarde este arquivo para uso posterior Seção 2: Informações de estrutura primária da proteína Copie a primeira seq a partir do arquivo.txt gerado na Seção 1 > Entre em http://www.expasy.ch/tools/ > link ProtParam > cole a seq de interesse na caixa indicada Or you can paste your own sequence in the box below > clique em compute parameters > explorar os dados disponíveis (no de aminoácidos da proteína, pi...copie e guarde tudo!) Ao final desta Seção vocês terão: 1) informações de seqüência primária da seq de interesse 2) alguns parâmetros físico-químico da seq de interesse Seção 3: Ocorrência de peptídeo sinal/predição de localização subcelular Copie a seq de interesse > retorne em http://www.expasy.ch/tools/ > link SOSUI > link SOSUIsignal > cole a seq de interesse em Enter your sequence with... > clique em Exec > explorar os dados disponíveis (se a proteína tem ou não peptídeo sinal, se é solúvel ou não...copie e guarde tudo!) Ao final desta Seção vocês terão: 1) existência de peptídeo sinal

2) se a proteína é solúvel ou de membrana Seção 4: Alinhamento das seq de interesse Entre em http://www.mbio.ncsu.edu/bioedit/bioedit.html#downloads > no final da página, escolha Version 7.0.7 > salve no seu computador > abra e execute o programa > File > Open > encontre o arquivo.txt gerado ao final da Seção 1 > as 5 seq salvas aparecerão em ordem no programa > vá em Accessory application > ClustalW Multiple alignment > aparece uma caixa de diálogo > clique em Run ClustalW > uma outra caixa de diálogo aparece > clique em ok > a nova janela aberta apresenta as 5 seqs alinhadas > mantenham esta janela aberta, ela deve ser o local de partida para os três caminhos seguintes: Caminho 1: determinação das regiões de maior e menor hidrofobicidade da proteína: localize a sua seq de interesse entre as 5 seqs na janela do alinhamento anterior > selecione a seq de interesse clicando sobre a identificação dela (gi 954761 ) > vá em Sequence > opção protein > escolha Kyte & Doolitle Mean hydrophobicity Profile > clique em Run Plot > salvar o gráfico de hidrofobicidade da seq (observar que o eixo position do gráfico equivale à posição do aminoácido representado pelos números que aparece nas seqs alinhadas > no gráfico, encontrar as regiões de maior e menor hidrofobicidade (picos superior e inferior) > encontrar na seq primária o trecho de aminoácidos responsável por elas. Caminho 2: montagem da figura final do alinhamento: Na janela do alinhamento anterior > selecionar as 5 seqs alinhadas clicando na identificação de cada uma delas (tem que estar com o Ctrl pressionado) > vá em File > opção Graphic View > preencha a janela que foi aberta exatamente como segue:

copiar a figura do alinhamento em Edit > opção Copy Page as an enhanced Windows metafile > colar em arquivo.doc ou.ppt para montagem do trabalho final (caso a figura do alinhamento seja muito grande, vai ser necessário copiar em duas partes e montar uma figura final única) > explorar os dados disponíveis (se existe algum aminoácido diferente na seq de interesse) > analisar esta diferença levando-se em conta a natureza do aminoácido diferente comparado com a natureza do aminoácido que ocorre na mesma posição nas outras seqs (copie e guarde tudo!) Caminho 3: Determinação de regiões conservadas Na janela do alinhamento anterior > selecionar as 5 seqs alinhadas clicando na identificação de cada uma delas (tem que estar com o Ctrl pressionado) > vá em Alignment > opção Find Conserved Regions > uma caixa de diálogo vai ser aberta > clique em Start > explorar os dados disponíveis (encontrar os trechos indicados como conservados no alinhamento e checar a correspondência entre os aminoácidos das seqs alinhadas para aqueles trechos...copie e guarde tudo!) Ao final desta Seção, vocês terão: 1) os principais trechos responsáveis pelo caracter hidrofóbico e hidrofílico da proteína

2) o quanto as proteínas se parecem, se existe alguma diferença na composição de aminoácido entre elas 3) quais seriam os trechos conservados da proteína Seção 5: Avaliação do grau de parentesco Retorne em http://www.expasy.ch/tools/ > opção CLUSTAL W > link EBI > na nova página > na opção Upload a file clique em Procurar > localize o arquivo.txt gerado na Seção 1 > clique em Run > aguarde enquanto o arquivo é processado > uma página com vários resultados vai ser gerada > vá até o final da página no item Cladogram > clique em Show as Phylogram Tree > voltar ao final da página > para copiar a figura da árvore filogenética vocês usarão o recurso Print Screen do computador (tecla PrtSc) > abrir qualquer programa de foto disponível no seu computador > colar a imagem > selecionar apenas a parte da imagem que equivale à árvore filogenética > copiar > colar em arquivo tipo.doc ou.ppt para a montagem do trabalho final > observar se agrupamento feito entra as seqs tem alguma correlação com o país de origem de cada seq Ao final desta Seção, vocês terão: 1) Uma figura informativa do agrupamento das seqs de acordo com as semelhanças entre elas Seção 6: Avaliação da estrutura terciária/quaternária da proteína Copie a primeira seq a partir do arquivo.txt gerado na Seção 1 (somente as letras que correspondem aos aminoácidos) > retorne em http://www.expasy.ch/tools/ > opção CPHmodels > cole a seq na opção Paste a single sequence or several sequences in FASTA format into the field below: > aguarde o processamento do arquivo > no final da página de resultados vocês encontrarão uma caixa preta, ela contem o modelo da estrutura para a seq de interesse > observem que vocês podem rodar (segure o botão esquerdo do mouse e movimente) ou alterar a escala da imagem (segure o botão direito e arraste para direita ou esquerda) > para copiar a figura do modelo estrutural vocês usarão

o recurso Print Screen do computador (tecla PrtSc) > abrir qualquer programa de foto disponível na seu computador > colar a imagem > selecionar apenas a parte da imagem que equivale à árvore filogenética > copiar > colar em arquivo tipo.doc ou.ppt para a montagem do trabalho final Ao final desta Seção, vocês terão: 1) O modelo da estrutura terciária da seq de interesse Seção 7: Busca por estrutura semelhantes à proteína de interesse Entre no site http://www.rcsb.org/pdb/home/home.do > escreva o nome da proteína de interesse (em inglês, ex.: hemoglobin) ou a seqüência (obtida após o Blast da seção 1). Se utilizar a busca pelo nome: clique Search > entre os resultados observar pelo nome da proteína aquela que estaria mais relacionada com a sua proteína de interesse (dar preferência para proteínas que cuja estrutura foi determinada na presença de um ligante, isso pode lhes ajudar a determinar a região chave na estrutura da proteína) > clique no link download PDB file como abaixo (seta vermelha) > salve o arquivo.pdb Se utilizar a busca pela seqüência: clique Adv. search > Choose a query type > Sequence (Blast/Fasta) > cole sua seq na caixa em branco > evaluate query.

a estrutura salva poderá ser visualizada em um programa chamado RasMol > para fazer o download dele, vá em http://www.bernstein-plussons.com/software/rasmol_2.7.2/ > no final da página tem um link RasWin.exe > salve em seu computador > execute o programa > abra o arquivo.pdb salvo anteriormente > utilize as ferramentas do programa para movimentar a estrutura > copie as imagens que vocês acharem mais interessantes > cole em arquivo.doc ou.ppt para montagem do trabalho final. Ao final desta Seção, vocês terão: 1) O modelo da estrutura terciária de uma proteína semelhante à proteína de interesse Seção 8: Agrupamento de informações Baseado nos conceitos gerais sobre estrutura e função de proteínas desenvolvidos em sala e nas informações específicas obtidas nas Sessões acima, monte uma apresentação (ex.: no PowerPoint) objetivando contar a estória específica da proteína de interesse. Lembrando que toda estória precisa ter princípio ( informações de estrutura primária),

meio ( informações de estrutura secundária ) e fim ( informações de estrutura terciária e quaternária e função ). Bom trabalho!