Determinação Estrutural de Proteínas e Peptídeos por RMN Fábio C. L. Almeida
Informações fornecidas pela RMN INTENSIDADE - Número de núcleos que dá origem ao sinal DESLOCAMENTO QUÍMICO - Ambiente químico dos núcleos ACOPLAMENTO ESCALAR - Geometria molecula ACOPLAMENTO DIPOLAR Matriz de distância entre núcleos
Informações fornecidas pela RMN Difusão Rotacional - T1, T2, NOE Tempo de correlação - c Interações intermoleculares Interações espaciais Difusão Translacional Coeficiente de difusão Dimensões moleculares
Proteína Avaliação Inicial -Espectros 1d, HSQC -Marcação Isotópica e sequenciamento Assinalamento Sequencial TOCSY, NOESY Tripla Ressonância Assinalamento Cadeia Lateral TOCSY, NOESY HCCH-TOCSY CCCONH, HCCCONH HBHACONH Métodos Semi-Automáticos NOESY-HSQC ARIA, AtnosCadid-Cyana Assinalamento NOEs e Cálculo da Estrutura Refinamento Estrutura
Proteína Avaliação Inicial -Espectros 1d, HSQC -Marcação Isotópica e sequenciamento Assinalamento Sequencial TOCSY, NOESY Tripla Ressonância Assinalamento Cadeia Lateral TOCSY, NOESY HCCH-TOCSY CCCONH, HCCCONH HBHACONH Métodos Semi-Automáticos NOESY-HSQC ARIA, AtnosCadid-Cyana Assinalamento NOEs e Cálculo da Estrutura Refinamento Estrutura
RMN de 1 H - 1D Peptídeo aromáticos CH 3 amídicos CH CH 2
RMN de 1 H - 1D Proteína aliphatic Backbone HN methyl aromatic H Side chain HN
PW2 (HPLKQYWWRPSL) - 4 mm Sem SDS 30 mm 40 mm 50 mm 80 mm 120 mm 160 mm
Proteína E7 do HPV16-98 aminoácidos - 11 kda HMQC 1D 15 N/ 1 H Sem TFE 2,5% TFE 5 % TFE 10% TFE 20% TFE 50% TFE
HSQC 2D 15 N/ 1 H da E7 do HPV16-11kDa (98 aa) Intrinsically Disordered Protein - IDP
HSQC - TRX
Proteína Avaliação Inicial -Espectros 1d, HSQC -Marcação Isotópica e sequenciamento Assinalamento Sequencial TOCSY, NOESY Tripla Ressonância Assinalamento Cadeia Lateral TOCSY, NOESY HCCH-TOCSY CCCONH, HCCCONH HBHACONH Métodos Semi-Automáticos NOESY-HSQC ARIA, AtnosCadid-Cyana Assinalamento NOEs e Cálculo da Estrutura Refinamento Estrutura
TOCSY Acoplamento escalar O C d O - H - C g - H H b H g R H - C b - H R... N - C - C - N - C - C - N - C - C... H H H O H H O H H O NH A. Bax & D.G. Davis, J. Magn. Reson. 65, 355-360 (1985)
TOCSY
H H b H g PW2 (HPLKQYWWRPSL) 1 H 1 H
PW2 (HPLKQYWWRPSI) L Q K R 1 H H Y W W S H/I 1 H
Marcação seletiva da Proteína Heteróloga Rifampicina - Liga-se a subunidade b da RNA polimerase da E. coli, inibindo a iniciação da transcrição. - Não inibe a T7 RNA polimerase - responsável pela expressão da proteína heteróloga Vantagens Economia de tempo no preparo da amostra e dos gastos com meio de cultura marcado Permite uma rápida análise do conteúdo estrutural da proteína Almeida et al. J. Magn. Reson. 148, 142-146 (2001)
TRX Purificada Extrato Celular Rifampicina Almeida et al. J. Magn. Reson. 148, 142-146 (2001)
Galvão-Botton et al., 2003
NOESY Acoplamento dipolar Interação dipolar entre H a menos de 5 A de distância NOE 1. f( c ) r 6 0. 5-1.0 N O E 0. 1 1. 0 10 w c Macromoléculas ( c > w o -1 ) - difusão de spins pode influenciar na intensidade do NOE observado
DIFUSÃO DE SPINS r - 6 1,2 1 2 r - 6 1,3 r - 6 2,3 3 Relaxação cruzada direta 1 e 2, 1 e 3 difusão do spin 1 para spin 2 e do spin 2 para o spin 3 Em certas condições experimentais este caminho pode ser mais eficiente que a relaxação cruzada entre o spin 1 e o spin 3. NOE não é uma manifestação da distância r -6 1,3
Curva de crescimento de NOE NOE 0.3 H F22 0.2 Y23 0.1 C30 0.1 0.2 0.3 0.4 s
NOESY
NOESY - assinalamento seqüencial - caracterização de estrutura secundária - cálculo da estrutura terciária Hd Hb Ha HN
NOESY - região amídica
Notação para distâncias 1 H - 1 H em proteínas d N (i,j) d( H i, NH j ) d NN (i,j) d(nh i, NH j ) d bn (i,j) d(bh i, NHj) d (i,j) d( Hi, Hj) d b (i,j) d( Hi,bHj)
Prolina: As distâncias NH i, H i, dch 2(i+1) e H (i+1) são fortemente afetadas pela isomerização cis-trans. PROLINA CIS: contatos entre H i e H (i+1) e entre NH i e H (i+1) PROLINA TRANS: curtas distâncias entre H i e dch 2(i+1) e entre NH i e dch 2(i+1)
NOESY Hélices d NN (forte) d N d N(i, i+3) d N(i, i+4)
Folhas b d N (i, i+1) (forte) d d N entre folhas adjacentes d NN H NOEs troca lenta Ligações de H
NOEs característicos observados em estruturas secundárias Helix 1234567 b strand 1234567 turn I 1234 turn II 1234 Half-turn 1234 d NN(i, i+1) d N(i, i+1) d N(i, i+3) d b(i, i+3) d N(i, i+2) d NN(i, i+2)
Assinalamento dos núcleos de 1 H, 13 C e 15 N Proteínas com mais de 40 aminoácidos sobreposição dos sinais Podem ser aplicados a proteínas não enoveladas
RMN 3D 13 C 15 N ou 13 C 1 H 15 N 1 H 1 H Tripla ressonância HNCA, HNCOCA, HNCACB NOESY-HSQC TOCSY-HSQC
Experimentos 3D Preparação t1 Evolução m1 Mistura t2 Evolução m2 Mistura t3 Detecção t1 evolução da magnetização com seus deslocamentos químicos característicos m1 interação da magnetização através do acoplamento escalar ou NOE t2- detecção do sinal num experimento 2D. No 3D possibilita a detecção da troca de magnetização
Análise do espectro Há casos onde a transferência de manetização de um núcleo para outro é observada durante o primeiro processo de mistura (F1 F2) e a magnetização é então transferida para um terceiro núcleo no segundo processo de mistura (F2 F3). 15 N ou 13 C 1 H 1 H
Experimentos 3D Homonuclear Face NOESY F2 F1 Face TOCSY F3 Envolvem um único tipo de núcleo (p. ex.: 1 H) Correlaciona os vários núcleos através de acoplamento escalar (COSY, TOCSY) ou através do espaço (NOESY) pela combinação de dois experimentos 2D
Experimentos 3D Heteronuclear Envolvem pelo menos dois tipos de núcleo Correlaciona os núcleos através de acoplamento escalar (COSY, TOCSY, HMQC, HSQC) ou dipolar (NOESY) pela combinação de dois experimentos 2D F2 F1 1 H F3 1 H X = 15 N ou 13 C
Experimentos 3D Heteronuclear F2 F1 1 H F3 1 H X = 15 N ou 13 C J. Magn. Reson., 78, 588 (1988).
Desacopla 1 H do Heteronucleo A eficiência da transferência de magnetização irá depender da duração do tempo de mistura F2 F1 1 H F3 1 H X = 15 N ou 13 C
F2 F1 1 H F3 1 H X = 15 N ou 13 C
1 H ao longo de F1 Como todos os 1 H são ligados ao heteronúcleo (amostras enriquecidas), o desacoplador é ligado para eliminar o acoplamento com o núcleo X A magnetização e levada de volta ao eixo z (como no NOESY normal) onde ocorre a construção dos picos de correlação via relaxação cruzada 45- -45 : recria a magnetização transversa
Experimentos de Tripla Ressonância
NOESY-HSQC
13C NOESY-HSQC
HNCA
HNCA
HNCOCA
CBCANH
CBCANH
HCCH-TOCSY
HCCH-TOCSY
HCCH-COSY
CSI - Chemical Shift Index
Troca de H por D
Troca de H por D
Ângulo Diedro R C H C O H O R N C C N R H H C H i i + 1
Relação de Karplus: ( 3 J - vicinal) J ( ) = A cos 2 ( - 60º) - B cos ( - 60º) + C Bystrov (1976) e Pardi (1984) = ( - 60º) 3 J HN = 6.4 cos 2-1.4 cos + 1.9
HNCA-J
HNCA-J
Constante de Acoplamento e Estrutura Secundária hélice ( = -57 ), 3 J HN = 3.9 Hz hélice 3 10 ( = -60 ), 3 J HN = 4.2 Hz folha b antip ( = -139 ), 3 J HN = 8.9 Hz folha b paral. ( = -119 ), 3 J HN = 9.7 Hz Hélices Folhas b 3 J HN < 6.0 Hz 3 J HN > 8.0 Hz Randômica 3 J HN = 6-8 Hz Obs.: Na presença de prolinas poderão ocorrer desvios desta regra J pode ser determinada usando os espectros: COSY, TOCSY, ou HNCA-J
Gráfico de Estrutura Secundária
Restrições Para o Cálculo da Estrutura Intensidade ou volume dos picos do espectro NOESY são convertidos em distância. Classificação dos NOEs Intensidade do NOE NOE ij ~ 1/r ij 6 Intra-resíduo ou seqüencial NH, H, Hb Média ou longa distância, NH, H, Média ou longa distância, cadeia lateral fraco 2.0 4.0 2.0 4.0 2.0 5.0 médio 2.0 3.0 2.0 4.0 2.0 5.0 forte 2.0 2.5 2.0 4.0 2.0 5.0
Restrições Para o Cálculo da Estrutura Angulos diedros obtidos a partir das medidas de J Indicar as ligações de hidrogênio existentes - Obtidas dos experimentos de troca H-D Converter as restrições de distância e ângulos de torção em uma estrutura visível (INSUFICIENTE!!!) são adicionados valores empíricos do comprimento da ligação de todos os átomos covalentemente ligados e os ângulos de ligação
Cálculo da Estrutura Terciária Calcula-se uma estrutura inicial randômica a partir dos valores empíricos e da seqüência de aminoácidos
Cálculo da Estrutura Terciária Sem as restrições experimentais determinadas pelos espectros de RMN (distâncias e ângulos de torção) a molécula pode adotar um grande número de conformações devido ao grande número de rotações em torno das ligações químicas Deve-se determinar o maior número possível de restrições experimentais para que seja obtida uma estrutura mais próxima do real. O número de restrições aplicadas é mais importante que a precisão das medidas de distância
Métodos para o cálculo da estrutura Distance Geometry (DG) - Calcula matrizes de restrições de distância para cada par de átomos de todas as restrições viáveis, ligações, ângulos de torção e raio de van der Waals. Este conjunto de distâncias é projetado de um espaço n-dimensional para o espaço tridimensional do sistema de coordenadas cartesianas, que determina todas as coordenadas de todos os átomos da proteína Simulated Annealing (SA) - É um método de dinâmica molecular, que ocorre diretamente no sistema de coordenadas cartesiana. Neste método, a estrutura inicial é aquecida a alta temperatura (simulação). Através de discretos passos de resfriamento a estrutura pode ir para uma estrutura final energéticamente favorável
Simulated Annealing Potenciais de Energia Durante a simulação a estrutura inicial (estendida ou enovelada) é colocada em uma campo de potencial sob a influencia de várias forças, o qual contém toda informação sobre a proteína. Estão envolvidas duas classes de energia: V = E empirical + E effective E efetiva = E NOE + E torção E empirica = E ligação + E angulo + E diedro + E VDW + E elstrostática
Simulated Annealing E empíco - contem toda informação sobre a estrutura primária da proteína e também dados sobre topologia e ligações na proteína em geral. Contribuições covalentes -aproximadas por uma função harmonica Contribuições não covalentes - são simuladas por potenciais de Lennard-Jones ou Coulomb, respectivamente. E efetivo - As restrições de ângulo e de ângulo diedro são introduzidas por uma função harmônica Restrições de distância: energia potencial é ajustada para zero se as distâncias correspondentes estão dentro de uma determinado limite. Caso contrário, um potencial de energia harmônico é usado para ajustar os valores para dentro destes limites.
Protocolo Simulated Annealing
Protocolo do Simulated Annealing Minimização da energia através do movimento dos átomos da estrutura inicial até que um mínimo de energia seja atingido. Estrutura em um mínimo local, sem satisfazer as restrições em várias regiões. Aquecimento simulado do sistema acima de 1000 K para fornecer energia suficiente para romper a barreira de energia e atingir um mínimo global. As posições atômicas no final do passo de simulação são determinadas da sua posição inicial. Após o passo de simulação a energia potencial é recalculada para as novas posições atômicas e seguem-se novos passos de simulação
Protocolo do Simulated Annealing Após mais de 6000 passos de simulação a alta temperatura a velocidade dos átomos (temperatura) é lentamente reduzida em muitos passos (~ 3000) A cada temperatura o sistema é deixado evoluir sob a influencia de um campo de energia potencial. Simultaneamente, as constantes de força das restrições experimentais são elevadas para que atuem mais fortemente. O resultado da simulação é a estrutura da proteína em um mínimo de energia, que pode não ser um mínimo global. O protocolo é interativamente repetido até o mínimo global seja atingido e as estruturas convirjam no espaço conformacional
A família de estruturas A qualidade de uma estrutura de RMN pode ser definida pelo desvio mínimo de cada estrutura de sua família (RMSD)
PW2 - HPLKQYWWRPSI 20 estruturas de menor energia RMSD 1-12 4-10 bb 1.37 +/- 0.44 0.59 +/- 0.26 heavy 2.01 +/- 0.56 0.99 +/- 0.42
Potencial positivo Potencial negativo
Estratégia de perdeuteração
Efeito da perdeuteração no espectro 2D HSQC editado para 15 N da alça menor da Ca 2+ -ATPase em micelas de SDS 1%
Largura da linha (Hz) Contribuição da interação dipolar 30 20 C - H 10 5 C - D 2 10 20 Tempo de correlação (ns)
Acoplamento Dipolar Residual
Meios usados para alinhar biomoléculas com o campo magnético bacteriófago bicelas
Procedimento para determinar o domínio relativo de orientação em proteínas com múltiplos domínios a) o alinhamento é determinado pela perspectiva de cada domínio b) os domínios são rodados para que tenham um alinhamento comum
Acoplamento Dipolar Residual B 0 (3cos 2-1)/ r 3 = 0 meio isotrópico C 15 N r 1 H C
Variação do valor de J conforme a posição do vetor com relação ao campo (a) (b) a) HSQC acoplado em H 2 O b) HSQC acoplado em meio anisotrópico 15 N 15 N 1 H 1 H
TROSY - Transverse Relaxation Optimized Spectroscopy
a) [ 15 N, 1 H] COSY desacoplado b) [ 15 N, 1 H] COSY acoplado c) TROSY 15 N, 1 H
Previsão do alargamento de linha considerando a proteína em H 2 O a 20 o C e freqüência de 1 H a 750 MHz e com os 1 H não lábeis substituídos por 2 H 150 kda - c = 60 ns 800 kda - c = 320 ns
O Alergeno Art v 1 Artemisia vulgaris -> Asteraceae originaria da Europa Encontrada América do Norte e Asia
Alergenos do polen de A.vulgaris -Proteínas de 10, 14, 20, 28, 46, 64 kda -Somente Art v 1 e Art v 4 foram caracterizadas molecularmente -90% dos pacientes alergicos a A.vulgaris são sensibilizados por Art v 1 (10KDa) -14% por Art v4 (14KDa) (Jeah- schimid et al. 2006) -A resposta celular T a Art v1 é predominantemente feita por T H 2-citocinas -Entretanto, diferentemente dos outros alergenos -> 1 único epitopo de Células T (25-36)
Art v 1 é formado por dois domínios Glicoproteína Hidroxiprolinas Ligadas a β-arabnoses β-galactanas α- arabnoses 15KDa 13KDa (Leonard et al., 2005)
Objetivos Parte I Assinalar as frequencias de ressonância do alergeno Art v 1 Determinar a estrutura do Art v 1 Estudar a dinâmica da cadeia principal desta proteína Avaliar a estrutura da Art v 1 nativa da planta Mapear o epitopo de interação com IgE
Razzera et al., 2009a (Biomol.NMR Assign)
Razzera et al., 2009a (Biomol.NMR Assign) Metodologia Expressão 15 N/ 13 C Purificação Troca Iônica n n+1 n+2 n+3 n+4 Espectrômetros (600 e 800 MHz) N N +4 N +4 N +2 N +2 Assinalamentos Programa CARA N +1 N +1 N +3 N +3 HCAN (Assin.Prolinas) N +5 HNCACB HBHACACB(CO)NH HCCH-TOCSY (Cadeia principal e Cadeia lateral)
Razzera et al., 2009a (Biomol.NMR Assign)
Razzera et al., 2009a (Biomol.NMR Assign)
P22357 e AAM27914 Helianthus anus 1AYJ Defensina Rs-Afp1 S66221 Dahlia merckii 1BK8 Defensina Ah Amp1 Razzera et al., 2009b (Manuscrito em preparação
Razzera et al., 2009b (Manuscrito em preparação DW116026 Lactuca seriola DY835145 Taraxacum officinale Asteraceas
Estrutura Art v 1 Razzera et al., 2009b (Manuscrito em preparação
Estrutura Art v 1 Razzera et al., 2009b (Manuscrito em preparação
Estrutura Art v 1 Razzera et al., 2009b (Manuscrito em preparação
Resumo das Restrições Conformacionais e da Análise Estatística Restrições Experimentais NOE 666 Intraresiduais (i, i) 163 Sequenciais (i, i ± 1) 219 de Média distância (1 < i - j < 5) 71 de Longa distância ( i - j 5) 211 Ligações de Hidrogênio 54 Ângulos de Dihedro 56 Ф ( ) 28 Ψ ( ) 28 Rmsd em relação a estrutura média Resíduos de regiões estruturadas (3-56) Esqueleto protéico (Å) 0.50 ± 0.12 Todos os átomos pesados (Å) 1.05 ± 0.18 Qualidade da Estrutura Ramachandran plot (PROCHECK) Regiões favoráveis (%) 59.9 Regiões adicionais favoráveis (%) 39.4 Regiões ainda permitidas (%) 4.2 Regiões não-permitidas (%) 1.4 CYANA Target Function ( Å 2 ) 0.74 ± 0.36 Razzera et al., 2009b (Manuscrito em preparação)
CSP Comparação entre Art v 1 Recombinante e Nativa B V97 P96 P103 P104 P95 A 0,30 0,25 0,20 0,15 0,10 0,05 8 Δδ + σ 6 34 7 Δδ 42 0,00 0 10 20 30 40 50 60 70 80 90 100 110 58 65 71 103 57 70 80 88 95 89 104 68 87 64 69 56 86 96 63 50 53 77 62 Resíduo 72 90 Razzera et al., 2009b (Manuscrito em preparação) 97 C A77 P58 P80 A42 P105 T107 P108 P88 A90 P86 P87 H34 Y50 K8 P96 V97 P95 P103 P104 T107 P105 H108 P106 P89 A90 P86 P88 P87 C53 H34 P71 Y50 P69 C6 P64 A68 P70 A63 K8 S56 P62 P57 C6 E7 C53 A63 P62 A72 P64 S56 A42 P57 P58 P80 P77
CSP Razzera et al., 2009b (Manuscrito em preparação Interação com IgE A 0,035 0,030 3 0,025 CSP 0,020 0,015 4 45 55/56 63 85 108 0,010 0,005 50 8 14 18 41/4246 74/75 93 0,000 0 10 20 30 40 50 60 70 80 90 100 110 Resíduo
B C N A63 S56 S3 K4 C N A63 S56 K55 S3 K4 K55 C B C G75 D18 E45 N G75 D18 E45 D S14 S14 E41 S46 D40 C N E41 S46 D40 C N
IgE Célula B