Computação: Reflexões 24/02/10 alerpaschoal@gmail.com
Computação + Bioinfo Pra que preciso em Bioinformática? Ou melhor, que tipo de contribuição a computação pode nos dar para um Biólogo ou afim?
Exemplo Experimento (Geração de dados) Coleta e Análise de dados
Exemplo 2 Fonte: http://mezeylab.cb.bscb.cornell.edu/researchevolgeno.aspx
DNA Evolution Fonte: PMID: 20625424
DNA Evolution Fonte: PMID: 20625424
Futuro ( Presente ) Fonte - PMID: 19906227
Nova camada no Dogma Fonte: Machado-Lima, 2007
Complexidade: CDS x ncrnas Taft et al. 2007 PMID: 17295292
RNAs não codificantes ou ncrnas Definição (Adaptado): RNAs não codificantes ou ncrnas (do inglês noncoding) são RNAs não traduzidos e que podem possuir função biológica Fonte: Eddy SR. Nat Rev Genet. 2001.
Interesse nos ncrnas John S. Mattick. The Genetic Signatures of Noncoding RNAs. PLoS Genetics. Review, 2009.
Geração de dados > do que capacidade de armazenamento Fonte: http://arstechnica.com/science/news/2010/11/preserving-science-choosing-what-data-to-discard.ars
NGS ER Mardis. Nature 470, 198-203 (2011) doi:10.1038/nature09796
Contudo: existem limitações Crescente a geração de dados Manipulação das informações para resposta de interesse Como tratar todos esses dados de modo a ajudar integração e contribuir para responder as perguntas de interesse!??!
Entretanto Grande quantidade de programas Next-Generation Sequencing (NGS) o Grande Quantidade Dados Inviável uso da maioria dos programas ab initio ou afins escala genômica Análise (montagem): não trivial. Tamanho pequeno, filtragem de falsos resultados Muitos reads, mas nem sempre muitos resultados (só mapeamento perfeitos)
NGS ER Mardis. Nature 470, 198-203 (2011) doi:10.1038/nature09796
Programação + BD Ferramentas básicas mara essa manipulação de dados OU melhor, podemos: - Filtrar, mascarar; - Selecionar dados ou fração de interesse - Copiar - Gravar - E muitas outras funções
Simbologia Linguagem de Programação: forma pela qual escrevermos algoritmos numa linguagem em que ambos* entendem para execução de uma ou mais tarefas. * Homem e Computador Banco de dados: - Coleção de informações sobre o mesmo contexto. - SGBD Sistema que gerencia um BD
Linguagem de Programação PERL Python Java C C++ Ruby E outras
Exemplo Dado um arquivos FASTA, faça um programa que: a-) Conta quantidade de sequências; b-) Mostra quantidade de cada nucleotíde: Geral Por sequência Etc.. e vários outros
Exemplo Muitos programas estão disponíveis na WEB - RNA fold
Programas em plataforma Unix-like A maioria dos programas voltados para para bioinformática são para plataformas Unix-like (Ex. Linux). Assim a importância de se aprender Linux Sugestões: - Guia Foca Linux (Iniciante, mas tem todos os níveis)
Exemplo Compactação/Descompactação de arquivos: - tar - gz - Já viu arquivo Nome.tar ou Nome.tar.gz
Exercício - BD Você tem uma coleção de genes de interesse que criar um local onde você pudesse saber: - Nome do gene Qual organismo; dados de função; possíveis Parálogos/Ortólogos; etc * E ai, como modelar isso? Planilhas? * Sempre devemos criar um BD?
Terminologias interessantes In silico Ab inition Predição prediction Approaches Complexidade algorítimica
Conclusão Saber linguagem de programação + BD ajuda a otimizar suas tarefas em bioinfo de forma mais rápida e eficiente Mesmo quem é da área Bio aconcelho entender um pouco sobre esse mudo. Ajuda a você tambéma se comunicar melhor com pessoal das Exatas.
Guia Foca Linux -Nível: Iniciante / Intermediário http://focalinux.cipsga.org.br/