ANÁLISE DE TRANSCRIPTOMA DE ARROZ SUBMETIDO A ESTRESSE BIÓTICO (FUNGO Magnaporthe oryzae)



Documentos relacionados
Comunicado219 ISSN X Dezembro, 2014 TécnicoSanto Antônio de Goiás, GO

A SEGUIR ALGUMAS DICAS PARA O DESENVOLVIMENTO DE UM PROJETO CIENTÍFICO

Metadados. 1. Introdução. 2. O que são Metadados? 3. O Valor dos Metadados

1. Explicando Roteamento um exemplo prático. Através da análise de uns exemplos simples será possível compreender como o roteamento funciona.

Capítulo 2. VARIÁVEIS DO TIPO INTEIRO

SISTEMA MEDLINK E-TISS PASSO-A-PASSO (USE JUNTO COM A VÍDEO AULA)

3 Estratégia para o enriquecimento de informações

Portaria Express 2.0

SIMULADO DO TESTE DE RESOLUÇÃO DE PROBLEMAS

7.012 Conjunto de Problemas 5

MANUAL DE UTILIZAÇÃO. Produtos: Saúde Pró Faturamento Saúde Pró Upload. Versão:

Projeto da Disciplina Parte1: Estudo de Viabilidade. Um Estudo de Viabilidade

Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

MINISTÉRIO DA SAÚDE. Secretária de Gestão Estratégica e Participativa da Saúde SGEP. Coordenação de Desenvolvimento dos Sistemas de Saúde - CDESS

Política Gestão de Configuração e Mudança

Orientações sobre o tratamento de dados dos documentos de identificação dos titulares de cartão de pagamento por parte das firmas comerciais

Áudio GUIA DO PROFESSOR. Idéias evolucionistas e evolução biológica

Tecnologia de faixa para falha

Nero AG SecurDisc Viewer

Permitir a troca de mensagens de texto entre os dois alunos; Permitir que um aluno enviasse para o outro uma cópia de prova;

TRANSMISSÃO DE DADOS Prof. Ricardo Rodrigues Barcelar

Configurando o Controle dos Pais no Windows Vista

REPRESENTAÇÃO DE DADOS EM SISTEMAS DE COMPUTAÇÃO AULA 03 Arquitetura de Computadores Gil Eduardo de Andrade

Manual MQS. Logo após colocar essas informações abrirá a página inicial do sistema:

5 Instrução e integração

Sistemas Operacionais. Curso Técnico Integrado Profa: Michelle Nery

Integração de livros fiscais com o Microsoft Dynamics AX 2009

Processo de Desenvolvimento de Políticas da LACNIC Versão 2.0. Objetivo do Processo de Desenvolvimento de Políticas da LACNIC

TÉCNICAS DE PROGRAMAÇÃO

Relato de Caso: Formação de Monitores da Oficina Desafio

Resolução da lista de exercícios de casos de uso

Análise de Pontos de Função. Por Denize Terra Pimenta

O desafio das correlações espúrias. Série Matemática na Escola

o hemofílico. Meu filho também será?

CAPÍTULO II. Funções e Portas Lógicas

UNIVERSIDADE FEDERAL DE GOIÁS PRÓ-REITORIA DE EXTENSÃO E CULTURA XI CONGRESSO DE PESQUISA, ENSINO E EXTENSÃO CONPEEX

Manual do Usuário - ProJuris Web - Biblioteca Jurídica Página 1 de 20

c. Técnica de Estrutura de Controle Teste do Caminho Básico

Atividade Proporcionalidade (vídeo)

Como desenhar e numerar as Redes e Galerias no DRENAR

Manual do usuário Neo Protocolo Free

MANUAL DA SECRETARIA

Compartilhe. Neste livro está uma das melhores e comprovadas maneiras de se ganhar dinheiro na internet.

QUALIDADE DE SOFTWARE

ELEIÇÕES PARA GOVERNADOR DISTRITO FEDERAL ANÁLISE DOS LOG'S. Belo Horizonte, Nov/2003. staff TECHNOLOGY

Atendimento WEB IAMSPE CEAMA v docx. Manual de Atendimento

Configurando a emissão de boletos no sistema

paradigma WBC Public - compra direta Guia do Fornecedor paradigma WBC Public v6.0 g1.0

Glossário de Termos Mais Usados

Figura 1: tela inicial do BlueControl COMO COLOCAR A SALA DE INFORMÁTICA EM FUNCIONAMENTO?

Usando o do-file editor Automatizando o Stata

INTERPRETANDO A GEOMETRIA DE RODAS DE UM CARRO: UMA EXPERIÊNCIA COM MODELAGEM MATEMÁTICA

Sumário. 1. Instalando a Chave de Proteção Novas características da versão Instalando o PhotoFacil Álbum 4

Auditoria de Segurança e Saúde do Trabalho da SAE/APO sobre Obra Principal, Obras Complementares, Obras do reservatório e Programas Ambientais

AGENDAMENTO PARA IMPORTAÇÃO DE NOTAS FISCAIS 1. PARÂMETROS DO ESTABELECIMENTO CONFIGURAÇÃO DO AGENDADOR... 3

INSTRUÇÕES DE INSTALAÇÃO

Professor conteudista: Hildebrando Oliveira

Agendador de Rotinas

Despesas com a Educação

A Comissão Científica do II Simpósio de Agroecologia da Bahia estabelece as normas de submissão de trabalhos descritas a seguir

Guia: como instalar o Ubuntu Linux

Resolução da Assembleia da República n.º 64/98 Convenção n.º 162 da Organização Internacional do Trabalho, sobre a segurança na utilização do amianto.

Correntes de Participação e Critérios da Aliança Global Wycliffe [Versão de 9 de maio de 2015]

Geração de mapas temáticos utilizando os programas GPS TrackMaker, Google Earth e Surfer

Início Rápido. Nero BackItUp. Ahead Software AG

ARQUITETURA E ORGANIZAÇÃO DE COMPUTADORES SISTEMAS DE NUMERAÇÃO: REPRESENTAÇÃO EM PONTO FLUTUANTE. Prof. Dr. Daniel Caetano

Instruções de Uso do sistema Sirc-Cartório

A Torre de Hanói e o Princípio da Indução Matemática

Orientações para Usuários

Implementando uma Classe e Criando Objetos a partir dela

OLIMPIADAS DE MATEMÁTICA E O DESPERTAR PELO PRAZER DE ESTUDAR MATEMÁTICA

11. LÓGICA ANIMAL. A lógica das classificações zoológicas

18º Congresso de Iniciação Científica IMPLEMENTAÇÃO DE UM MODELO DE TESTE DE APLICAÇÕES WEB

Catálogo de Padrões de Dados

ADMINISTRAÇÃO I. Família Pai, mãe, filhos. Criar condições para a perpetuação da espécie

Documento Descritivo do Mecanismo de Busca. Preparação do Portal para indexação

Densímetro de posto de gasolina

Funcionalidades do sistema SPED Contábil. Luiz Campos

UNIDADE 6 - PROGRAMAÇÃO MODULAR

ITIL v3 - Operação de Serviço - Parte 1

ANJOS E DEMÔNIOS. Uma história sobre o acesso e vínculo dos Latinoamericanos com novas plataformas de comunicação. Roberto Lobl, IBOPE Media

Princípios do teste de software

EATON Fácil V1.00 Guia de utilização

Primeiros passos das Planilhas de Obra v2.6

ORGANIZAÇÃO DE COMPUTADORES MÓDULO 1

1 ACESSO PARA SECRETÁRIA CONFIGURAR HORÁRIOS DE ATENDIMENTO BLOQUEANDO E HABILITANDO HORÁRIOS PRÉ-DEFININDO PARÂMETROS DE

Software. GUIA DO PROFESSOR Qual é a palavra? Genética humana e saúde

Gráficos estatísticos: histograma. Série Software ferramenta

Manual Ilustrado Utilitários Controle de Infecção Hospitalar

Manual Operacional SIGA

Inventário WMS. SCM Concept (47)

Probabilidade e Estatística I Antonio Roque Aula 11 Probabilidade Elementar: Novos Conceitos

Tema, Problema e Hipóteses

Como criar um blog. Será aberta uma janela onde você deverá especificar o título do blog, o endereço do blog, e o modelo.

Transcrição:

ANÁLISE DE TRANSCRIPTOMA DE ARROZ SUBMETIDO A ESTRESSE BIÓTICO (FUNGO Magnaporthe oryzae) Narciso, M.G.(1) ; Salvador, M.V. (1) ; Bevitóri, R. (1) marcelo.narciso@embrapa.br (1) Embrapa Arroz e Feijão, Santo Antônio de Goiás GO, Brasil. RESUMO Este trabalho é sobre como obter quais genes de uma variedade de arroz são expressos quando do ataque do fungo Magnaporthe oryzae, que causa a doença Brusone, às folhas de plantas de arroz. Em resposta ao ataque, são expressos alguns genes e silenciados outros genes, tanto para o caso do fungo quanto para o caso do arroz. Com a descoberta de quais genes são responsáveis pela defesa da planta e quais genes são expressos para que o fungo ataque a planta, é possível entender melhor todo o mecanismo da planta de arroz quando do ataque e assim produzir variedades mais resistentes à Brusone. As ferramentas computacionais para análise dos dados para se obter quais genes estão envolvidos no processo de defesa da planta são o enfoque deste trabalho e qualquer pessoa poderá realizar o mesmo procedimento. Palavras-chave: Resistência a Brusone, Genes, Software Tophat/Cufflinks. INTRODUÇÃO Um dos grandes obstáculos para o aumento da produtividade e estabilidade de produção de arroz é a brusone. Esta doença aparece por causa do fungo Magnaporthe oryzae. Desde seu aparecimento no Brasil, em 1912 (Averna-Sacca, 1912), ainda não existe controle

efetivo, determinando prejuízos grandes na Região Centro-Oeste onde, em situações mais drásticas, as perdas podem chegar a 100%, dependendo do genótipo, da época de plantio e das condições climáticas (Prabhu et al., 2003). São poucos os estudos conduzidos de análise do transcriptoma da interação arroz x M. oryzae e as bases moleculares dessa interação ainda não são completamente estabelecidas devido à mutação do patógeno. Nesse sentido, são de particular relevância os recentes avanços na genômica funcional que podem aumentar a eficiência do melhoramento convencional para o desenvolvimento de arroz com tolerância à deficiência hídrica, através da identificação, do isolamento e da caracterização de genes envolvidos na resistência a brusone. MATERIAL E MÉTODOS Nesse estudo, foi conduzido um experimento visando a obtenção de sequências de DNA expressas durante a infecção do arroz por M. oryzae. A cultivar dea arroz Metica 1, cultivada em bandejas de plástico em ambiente controlado, foi desafiada com isolado virulento e avirulento do fungo M. oryzae, aos 21 dias após a germinação. O isolado avirulento não causa brusone, e serve para comparação com o isolado virulento, que causa a brusone. A penúltima folha de cada uma das duzentas plantas, por tratamento, foi coletada 4 e 24h após 2

inoculação (hpi) com a suspensão conidial preparada conforme descrição de Prabhu et al., (1992). As folhas foram imediatamente congeladas em nitrogênio líquido e estocadas a 80 C até uso para extração de RNA. Foram coletadas 08 amostras de RNA total utilizando-se o kit RNAeasy (Qiagen). O seqüenciamento em grande escala foi realizado utilizando-se o equipamento Genome Analyser, da Solexa/Illumina. Posteriormente, análises de bioinformática, usando alguns softwares, foram utilizadas para comparação dos resultados entre os tratamentos. Foram usados para a verificação dos genes envolvidos no processo de defesa contra o fungo os softwates Tophat e cufflinks, que estão descritos em (Trapnell et al, 2012), e também sites de busca para descoberta de genes e a função destes genes que tenham ligação com a resistência a brusone. Como usar estes softwares e sites de busca e os resultados estão descritos a seguir. RESULTADOS E DISCUSSÃO Nesta secção serão apresentados os softwares usados para as análises e seus resultados, os quais vão mostrar os genes responsáveis pela resistência ao estresse biótico que a planta foi submetida e será discutido cada passo. 3

Inicialmente serão vistos os softwares tophat e cufflinks para obter as regiões do cromossomo que são ativadas e depois os genes que contém estas regiões e a finalidade destes, para então ver quais genes são ativados para combater o fungo e os que são silenciados. Este processo pode ser feito para várias outras finalidades, como por exemplo, para verificar que genes estão sendo expressos para que a planta retenha a maior quantidade de água possível quando em período de seca (tolerância a seca) ou de frio (tolerância ao frio). TopHat é um programa que alinha reads a um genoma referência (no caso deste trabalho, a variedade de arroz tropical japônica nipponbare) com a finalidade de identificar junções exon-exon. Isto é feito graças ao programa para mapear reads de comprimento curto (short reads) cujo nome é bowtie (ver BOWTIE, 2013). TopHat foi otimizado para reads com 50 pares de bases ou mais (se usar o software bowtie2) e menos de 50 pares de bases. No caso deste trabalho, como os reads contém 17 pb, e existem aproximadamente 711 mil reads distintos, então será usada a versão 1, conhecida por bowtie (BOWTIE, 2013). Mais sobre tophat pode ser visto em (TOPHAT, 2013). Para usar os reads, obtidos pelo Genome Analyser, descrito anteriormente, como entrada do software tophat, basta executar os comandos abaixo. 4

bowtie-build -f./nipponbare.fasta./nipponbare tophat --bowtie1 -p 16 -r 110 -o./saidametica./nipponbare./metica-f.fastq./metica-r.fastq O caso acima é para quando se tem os arquivos fastq forward (meticaf.fastq ) e reverso (metica-r.fastq). Para o caso single-end, com apenas um arquivo fastq (no exemplo abaixo, metica.fastq) o comando tophat é executado da seguinte forma: tophat --bowtie1 -p 16 -r 110 -o./saidametica./nipponbare./metica.fastq Para executar o software tophat, o primeiro comando é bowtie-build, que faz uma indexação do genoma referência (nipponbare.fasta), e a saída é o arquivo nipponbare, o qual serve de entrada para o comando tophat, que é executado logo a seguir. O segundo comando tem a opção bowtie1 que indica a execução do comando bowtie, versão 1, para reads com menos do que 50 pb. O parâmetro p indica a quantidade de processadores a serem usados, que no caso do exemplo foram 16. A saída produzida pelo comando estará no diretório saidametica. Os arquivos metica-f.fastq e metica-r.fastq são fornecidos pelo Genome Analyser, da Solexa/Illumina, já descrito anteriormente. Estes dois arquivos são gerados para o caso do ataque após 4h e também para o caso de 24 h. Assim, os comandos acima deverão ser executados duas vezes, uma vez para os dados gerados para 4h e outra vez para os dados gerados para 24 h. Após executar o comando tophat, no diretório 5

saidametica, serão gerados os sequintes arquivos com resultados obtidos: accepted_hits.bam, junctions.bed, insertions.bed e deletions.bed. O arquivo accepted_hits.bam é do tipo Binary Alignment/Map (TOPHAT, 2013) e será usado por outros comandos a serem descritos mais adiante. Após o comando tophat ter sido executado, serão executados os comandos para a montagem dos transcritos (Cufflinks), mistura de duas ou mais montagens de transcritos (Cuffmerge) e encontrar genes expressos e os transcritos obtidos de cada ensaio (Cuffdiff). Os comandos para executar estes passos são os seguintes: cufflinks -p 16 -o saidacufflinksmetica-4v accepted_hits-4v.bam cufflinks -p 16 -o saidacufflinksmetica-4av accepted_hits-4av.bam cufflinks -p 16 -o saidacufflinksmetica-24v accepted_hits-4v.bam cufflinks -p 16 -o saidacufflinksmetica-24av accepted_hits-4v.bam Os arquivos accepted_hits-4v.bam, accepted_hits-4av.bam, accepted_hits-24v.bam e accepted_hits-24av.bam são gerados a partir do comando tophat, conforme mencionado anteriormente. Arquivos do tipo bam são arquivos do tipo binary alignment map. Estes arquivos contêm dados diversos dos reads lidos pelo comando tophat e das montagens de alinhamentos obtidos. O comando cufflinks vai gerar, no diretório especificado pela opção -o saidacufflinksmetica-4v, o 6

arquivo transcripts.gtf, dentre outros. Assim, tem-se então 4 arquivos transcripts.gtf, um para cada ensaio. Estes arquivos, serão renomeados para transcripts-4v.gtf, transcripts- 4AV.gtf, transcripts-24v.gtf, transcripts-24av.gtf, para não confundir. Um arquivo, contendo os nomes destes quatro arquivos, chamado de transcritos.txt, será usado para executar o comando abaixo: cuffmerge -g./nipponbare.gtf -s./nipponbare.fasta -p 16./transcritos.txt O comando acima tem a opção g nipponbare.gtf. Este arquivo pode ser baixado a partir do site (www.phytozome.net). O comando cuffmerge serve para uma anotação única dos transcriptomas envolvidos. O resultado é um arquivo de nome merged.gtf. Após este comando, é executado o comando cuffdiff, tal como abaixo: cuffdiff -o diff_out_4 -b./nipponbare.fasta -p 16 -L C1,C2 -u merged.gtf accepted_hits-4v.bam accepted_hits-4av.bam cuffdiff -o diff_out_24 -b./nipponbare.fasta -p 16 -L C1,C2 -u merged.gtf accepted_hits-24v.bam accepted_hits-24av.bam No primeiro comando, são considerados os dados de 4h para o fungo virulento e 4h para o fungo avirulento. O segundo comando considera 7

os dados de 24h para o fungo virulento e 24h para o fungo avirulento. Os parâmetros usados nos comandos acima podem ser vistos em (Trapnell et al., 2012). A saída estará nos diretórios o diff_out_4 e o diff_out_24. Nestes diretórios têm vários arquivos contendo estatísticas diversas, e dentre eles o arquivo gene_exp.diff. Um trecho deste arquivo está a seguir. sample1 sample2 status value1 value2 log2(fold) test_stat p_value q_value signif C1 C2 OK 73678.6 10134.7-286.195 392.247 8,76E-03 0.040614 yes C1 C2 OK 1440.66 289.097-23.171 402.622 5,67E-03 0.0350514 yes C1 C2 OK 124.081 993.336 0.320928 0.403514 0.068657 0.955297 no C1 C2 OK 78292.9 110140 0.492385 0.818113 0.013293 0.936029 no Com este arquivo e outros gerados por este processo, é possível saber quais genes participam do processo de combate ao fungo da Brusone e quais não participam ou são silenciados. Estes arquivos são para os ensaios 4V x 4AV e 24V x 24 AV. Falta ainda verificar em que gene a sequência está. Assim, primeiro fazse um filtro do arquivo gene_exp.diff para quando significant = yes ou quando p-value é menor que um certo valor (0.01, por exemplo) e o valor absoluto de log(fold) for maior que um certo valor (2, por exemplo). Assim, usando o arquivo exemplificado, anteriormente, temse que as regiões do cromossomo que são ativadas são: sample1 sample2 status value1 value2 log2(fold) test_stat p_value q_value signif 8

C1 C2 OK 73678.6 10134.7-286.195 392.247 8,76E-03 0.040614 yes C1 C2 OK 1440.66 289.097-23.171 402.622 5,67E-03 0.0350514 yes C1 e C2 correspondem aos ensaios para 4V e 4AV, para o caso do primeiro comando cuffdiff apresentado, e 24V e 24AV para o segundo comando, ilustrado anteriormente. O trecho no qual está descrito onde a sequência está, e que complementa o exemplo dado, é o que está abaixo. test_id gene_id gene locus sample1 sample2 XLOC_000221 XLOC_000221 - Chr1:6281506-6281740 C1 C2 XLOC_000891 XLOC_000891 - Chr1:28731490-28732206 C1 C2 XLOC_000966 XLOC_000966 - Chr1:30184249-30184382 C1 C2 Foi verificado que para o caso 4V x 4AV, a quantidade de genes expressos para a defesa contra o fungo foi bem maior do que a quantidade de genes expressos para o caso de 24V x 24AV. Isto pode ser explicado por que o fungo, no início do ataque (4 h), tenta atravessar a barreira natural que existe na folha para sua proteção, isto é, as camadas de células \da epiderme, cutícula, etc.. Para obter as regiões nas quais as sequências obtidas foram escolhidas, foi feito o seguinte procedimento: 1) obter os cromossomos a partir da variedade referência nipponbare.fasta e gerar os arquivos cromo1.fasta,..., cromo12.fasta; 2) criar uma base de dados para busca usando o 9

comando makeblastdb para cada um dos 12 cromossomos. Por exemplo, para o cromossomo 1 makeblastdb -in./cromo1.fasta -input_type fasta -dbtype 'nucl' -out./cromo1.db; 3) obter as sequências desejadas, a partir do arquivo gerado por cuffdiff. Para exemplificar, para o caso do loci ser Chr1:6281506-6281740, então é executado blastdbcmd -db cromo1 -range 6281506-6281740 -dbtype nucl -entry all Estes comandos, makeblastdb e blastdbcmd, pertencem a um kit de busca do software BLAST feito pelo NCBI (ver www.ncbi.nlm.nih.gov/). A saida do commando blastdbcmd, para cada ChrXX:YYY-ZZZ, é uma sequência, tal como o exemplo abaixo: >gnl BL_ORD_ID 0:26174154-26174382 Chr7 TACGTGGTGCTCGGAGACGGCGGCCGCGGCGGGGAGAGAGG GGAGCCATGGAACATTAGGATAGAGGACGTGGATTAGGACC AGGATTATATTCTTCAAATTGGTTTCAATTGGTTTTAAGGTGG TCGATTTTTCTTTCGGTTTTTGTATATACA Com esta sequência, faz-se então uma busca através do gene ao qual a sequência pertence usando o comando blastn, tal como está feito abaixo, considerando-se que esta sequência está em um arquivo chamado saidacuff.fasta. O comando para isto é blastn -db nt -query saidacuff.fasta -num_threads 16. Outra forma de busca do gene pode 10

ser feita através do site do NCBI, (http://blast.ncbi.nlm.nih.gov/blast.cgi) usando a sequência desejada. Após a busca, são obtidos os genes, que tem a identificação do tipo, LOC_Os0RgXYZKW, R,X,Y,Z,k,W são números de 0 a 9. Com estes genes, faz-se uma busca sobre a função de cada um usando o site http://bioinfo.cau.edu.cn/agrigo. E a opção d Analysis Tool. Ao acessar esta opção, basta passar um conjunto de genes que o site mostra em que atividade cada gene participa, conforme ilustra a Figura 1. São vários genes envolvidos, e todos aqueles que tiverem GO terms stress response ou response to biotic stimulus ou biotic stress são genes que podem ser considerados candidatos a serem validados para verificar a participação deste no processo (o gene é poderá estar relacionado ao combate ao fungo). 11

Figura 1. Resultados de genes usando o site agrigo. CONCLUSÃO Este trabalho mostrou uma forma de uso de ferramentas computacionais para encontrar genes envolvidos em resposta a estresse biótico. Para o caso deste trabalho, foi enfocado o fungo que causa a 12

Brusone. Os softwares usados para a análise dos dados são gratuitos e qualquer pessoa poderá realizar este procedimento, para uma situação similar. O tempo de execução destes programas depende da quantidade de processadores que o computador que vai rodar os programas tiver. O tempo médio para executar estas tarefas de análise por tophat e cuffdiff é de 1 a 3 dias. Se o computador tiver apenas um processador, o tempo vai ser maior, mas a análise será feita da mesma forma. REFERÊNCIAS AVERNA-SACCA, R. O brusone do arroz. São Paulo, 1912. v. 13. (Boletim de agricultura). BOWTIE. Disponível em http://bowtie-bio.sourceforge.net/index.shtml, Site visitado em 25/09/2013. PRABHU, A. S.; FILIPPI, M. C.; CASTRO, N. Pathogenic variation among isolate of Pyricularia oryzae infecting rice, wheat and grasses in Brazil. Tropical Pest Management, v.38, p.367-371, 1992. PRABHU, A. S. Araujo, L.G. de; Faustina, C.; Berni, R.F. Estimation of grain losses caused by blast in upland rice. Pesquisa Agropecuária Brasileira,.Brasília, v. 38, p.1045-1051. 2003. TOPHAT. Disponível em http://tophat.cbcb.umd.edu/manual.html#toph. Site visitado em 25/09/2013. Trapnell, C.; Roberts, A.; Goff, L.; Pertea, G.; Kim, D.; Kelley, R.; Pimentel, H.; Salzberg, S.; Rinn, J.; Pachter, L. Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks. Published online 1 March 2012; doi:10.1038/nprot.2012.016. 13

14