IDENTIFICAÇÃO DE UMA ORF CODIFICADORA DE PROTEASE EM UMA BIBLIOTECA METAGENÔMICA DO CONSÓRCIO DEGRADADOR DE ÓLEO DIESEL IDENTIFICATION OF ORF ENCODING PROTEASE FROM METAGENOMICS LIBRARY CONSORTIUM DEGRADING OF DIESEL Resumo Bianca de Melo Silveira (1) Elwi Guillermo Machado de Sierra (2) Eliana Gertrudes de Macedo Lemos (3) A utilização de técnicas moleculares no estudo de amostras ambientais, têm ajudado à comunidade cientifica ao desenvolvimento de diversas pesquisas a partir de informações contidas no DNA, com interesse em processos biotecnológicos de grande importância industrial. As enzimas proteolíticas também conhecidas como peptidases têm uma infinidade de usos na indústria de alimentos, detergentes, biocombustíveis, medicamentos, bebidas, couro, pele e têxteis. Este trabalho teve como objetivo identificar um gene codificador de protease a partir do screening em biblioteca metagenômica do consórcio degradador de óleo diesel, utilizando sequenciamento de última geração. Com os dados do sequenciamento, através da ferramenta de bioinformática ORF Finder, foi possível detectar três genes codificadores de alfa beta hidrolases, na qual a protease encontra-se classificada. Palavras-chave: Enzima. Protease. Metagenômica. Abstract The use of molecular techniques in the study of environmental samples, have helped the scientific community to the development of various research from information contained in DNA, with interest in biotechnological processes of industrial importance. Proteolytic enzymes also known as peptidases have a multitude of uses in the food industry, detergents, biofuels, medicines, beverages, leather, fur and textiles. This study aimed to identify a protease encoding gene from the screening of metagenomic library degrading consortium of diesel oil using nextgeneration sequencing. With sequencing data through bioinformatics ORF Finder tool, it was possible to detect three genes encoding alpha - beta hydrolases, in which the protease is classified. Keywords: Enzyme. Protease. Metagenomics. 1 1 Mestranda em Microbiologia Agropecuária pela UNESP, Campus de Jaboticabal-SP; 2 Doutorando em Microbiologia Agropecuária pela UNESP, Campus de Jaboticabal SP; 3 Univ. Estadual Paulista UNESP, Campus de Jaboticabal- SP. E-mail contato: biancasilveira16@gmail.com
1 Introdução O solo é um ambiente extremadamente complexo, apresentando uma ampla diversidade nas populações microbianas, uma grande riqueza genética e um potencial biotecnológico quase inimaginável. Segundo Torvisk e Ovreas (2002), um grama de solo pode conter até 4000 espécies bacterianas distintas, dentre as quais a maior parte não é cultivável. Diante desta dificuldade, o emprego de técnicas moleculares como a metagenômica admite acessar as informações contidas no DNA presente em amostras ambientais, permitindo obter uma maior exploração na busca de novos genes, e um número quase ilimitado de biomoléculas e outros compostos de grande importância em processos industriais. As enzimas hidrolíticas como as proteases também conhecidas como peptidases são um dos principais compostos procurados para seu uso no processamento de alimentos, detergentes, biocombustíveis, medicamentos, bebidas, couro, pele e indústrias têxteis. O objetivo deste trabalho é a anotação gênica de enzimas proteolíticas de um clone da biblioteca metagenômica do consórcio degradador de óleo diesel. 2 Material e Métodos Na biblioteca Metagenômica do consórcio degradador de óleo diesel, foram prospectadas bioquimicamente sequências codificadoras para enzimas proteolíticas em 960 clones, obtendo se 26 clones com possível atividade proteolítica em meio LB sumplementado com skim milk (leite desnatado). Um dos clones (CRP16D11) foi selecionado após ensaio de atividade proteolítica com azocaseína (MORRIS, EVANS, & MARCHESI, 2012) para a construção de uma sub-biblioteca. Paralelo a isto foi realizado o sequenciamento do fosmídeo com a plataforma Illumina e o contig obtido foi analisado através de ferramentas de bioinformática BLAST (ALTSCHUL et al., 1990) e ORF Finder do National Center for Biotechnology Information (NCBI, Bethesda, Maryland, USA) avaliando parâmetros como Query coverage, E- value, e Identidade. A sequência de aminoácidos de três ORFs foi comparada com as sequências da base de dados de proteases - MEROPS (RAWLINGS et al.,2014) e analisadas por um alinhamento multiplo com outas proteases da mesma família usando o algorítmo CLUSTALW2 do BioEdit (HALL, 1999), em procura do motivo e domínio proteico conservado e localização dos aminoácidos do sitio catalítico. 3 Resultados e Discussão
As sequências obtidas foram agrupadas em um único contig formado por 29492pb, sendo possível identificar o Parvibaculum lavamentivorans DS-1 como um organismo presente na biblioteca Metagenômica do Consórcio Degradador de Óleo Diesel, podendo ser observado na tabela 1. Tabela 1. Análise, através do BLAST do contig referente ao clone CRP16D11. Foram colocados Descrição Organismo Query E. Value Identidade Acesso Coverage Parvibaculum lavamentivorans DS-1, 39% 0.0 83% CP000774. 1 genoma completo Mesorhizobium huakuii 7653R genoma 8% 0.0 75% CP006581. 1 Mesorhizobium loti MAFF303099 10% 0.0 75% BA000012. 4 DNA, genoma completo Mesorhizobium ciceri biovar biserrulae WSM1271, genoma completo 8% 0.0 74% CP002447. 1 Caulobacter crescentus NA1000, 14% 0.0 81% CP001340. 1 genoma completo Os cinco primeiros resultados fornecidos pelo NCBI. A presença do organismo Parvibaculum no consórcio microbiano degradador de óleo diesel, corrobora com outros estudos que revelam a frequência deste gênero em solos contaminados com hidrocarbonetos (WUNSCHE et al.,1995, HIGASHIOKA, et al., 2009; PIRÔLLO et. al., 2008). A partir da análise do contig com o software ORF Finder do National Center for Biotechnology Information (NCBI, Bethesda, Maryland, USA), foi possível identificar três ORFs (13, 14 e 19) codificadoras de alfa/beta hidrolases não classificadas, representadas no mapa físico ilustrado na Figura 1. Figura 1. Mapa físico das ORFs selecionadas, gerada pelo programa Pages 09, versão 4.04 (Apple Inc., Cupertino, Califórnia, Estados Unidos da América). A primeira (ORF13) é constituída de 391 aminoácidos e apresentou 83% de identidade com alfa/beta hidrolase (WP_011995394.1) de Parvibaculum lavamentivorans. A segunda (ORF14) de 297 aminoácidos e apresentou 64% de identidade com uma proteína hipotética (WP_045446911.1) da alfa Proteobacterium MA2. A terceira (ORF19) de 321 aminoácidos apresentando 69% de identidade com alfa/beta hidrolase (ABS62095. 1) de Parvibaculum
lavamentivorans. As análises com Bioedit identificou uma ORF ORF19 com todas as características próprias (motivo conservado e aminoácidos do sitio catalítico), de acordo com a Figura 2. Figura 2. Alinhamento da sequência ORF19 com as sequências de aminoácidos de representantes da família S9. = aminoácidos da tríade catalítica; = motivo conservado. 4 Conclusão As enzimas proteolíticas estão classificadas no grupo de enzimas hidrolíticas. Através da predição da sequência do contig do clone CRP16D11 no NCBI, admite-se afirmar que as ORFs podem apresentar uma protease com propriedades desconhecidas se comparadas com as proteínas do banco de dados do NCBI e MEROPS. Referências ALTSCHUL, S.F.; GISH, W.; MILLER, W.; MYERS, E.W.; LIPMAN, D. J. Basic local alignment search tool. Journal of Molecular Biology. n.215, v.3, p. 403 410, 1990. HALL, T. A. BioEdit: a user-friendly biological sequence alignment editor and analysis program for Windows 95/98/NT. Nucleic Acids Symposium Series. v.41, p. 95 98, 1999. HIGASHIOKA, Y.; KOJIMA, H.; SATO, S.; FUKUI, M. Microbial community analysis at crude oil-contaminated soils targeting the 16S ribosomal RNA, xylm, C23O, and bcr genes. J. Appl. Microbiol. v.105, p.1364-5072, 2009. MORRIS, L.S.; EVANS, J.; MARCHESI, J.R.; A robust plate assay for detection of extracellular microbial protease activity in metagenomic screens and pure cultures. Journal of Microbiological Methods, v.9, p.144 146, 2012.
PIRÔLLO, P.S.; MARIANO, A.P.; LOVAGLIO, R.B.; COSTA, S.G.V.A.O.; WALTER, V.; HAUSMANN, R.; CONTIERO, J. Biosurfactant synthesis by Pseudomonas aeruginosa LBI isolated from a hydrocarbon-contaminated site M. Journal of Applied Microbiology.v.105, p.1484 1490, 2008. RAWLINGS, N. D.; WALLER, M.; BARRETT, A. J.; BATEMAN, A. MEROPS: The database of proteolytic enzymes, their substrates and inhibitors. Nucleic Acids Research. v. 42(D1), p.343 350, 2014. TORSVIK, V.; OVREAS, L.; THINGSTAD, T. F. Prokaryotic diversity magnitude, dynamics, and controlling factors. Science, v. 296: p. 1064-1066, 2002. WUNSCHE, L.; BRÜGGEMANN, L.; BABEL, W. Determination of substrate utilization patterns of soil microbial communities: An approach to assess population changes after hydrocarbon pollution. FEMS Microbiol. Ecol. v.17, p.295-305, 1995.