Biologia Estrutural Solução do Problema da Fase Prof. Dr. Walter Filgueira de Azevedo Jr.
Resumo Introdução Problema da fase Função de Patterson Aplicação da função de Patterson Método da Substituição Isomórfica Múltipla (MIR) Substituição molecular Outros métodos Referências
Cristalização Coleta de dados LNLS Difração de raios X Análise Resolução da estrutura cristalográfica
Problema da Fase Vimos que ao realizarmos a coleta de dados difração de raios X, obtemos informações sobre as intensidades difratadas para cada reflexão I(hkl), sendo que a intensidade é proporcional ao módulo do fator de estrutura, como segue: I(hkl) α F(hkl) 2
Problema da Fase Mas a informação sobre a fase de cada reflexão é perdida no processo de registro da informação. Para o cálculo da função densidade eletrônica é necessário o termo de fase. A obtenção da fase para os fatores de estrutura é chamada solução do problema da fase. ρ(xyz) = (1/V)Σ Σ Σ F(hkl) exp {-2πi [(hx + ky+ lz) - α (hkl)]} h k l Os dois principais métodos para a solução do problema da fase para cristais de macromoléculas biológicas serão discutidos na presente aula.
Função de Patterson A função de Patterson é dada pela somatória de Fourier dos módulos dos fatores de estrutura, como indicado na equação abaixo: P(uvw) = Σ Σ Σ F(hkl) 2 cos {2π[(hu + kv+ lw)} h k l A função de Patterson é calculada para cada coordenada fracionária uvw. Fisicamente esta função é um mapa de vetores entre átomos, há um pico na função de Patterson para cada vetor interatômico. A grande vantagem da função de Patterson, é que a mesma não necessita de informação sobre a fase dos fatores de estrutura, e fornece alguma informação estrutural, visto que a partir da interpretação do mapa de Patterson (a representação gráfica da função de Patterson) podemos obter informação sobre posição dos átomos.
Função de Patterson Consideremos uma cela unitária bidimensional, com apenas 2 átomos, como representado na figura da esquerda. A função de Patterson é uma representação dos vetores interatômicos, ou seja, apresentará valores diferentes de zero somente para valores de uvw que indiquem distâncias interatômicas, assim a representação gráfica da função de Patterson, da cela unitária bidimensional é representada à direita. u u u u u u u u u
Função de Patterson Vamos considerar agora um exemplo numérico. Seja uma cela unitária tridimensional com dois átomos, com as seguintes coordenadas fracionárias: Átomo 1: 0,20, 0,31, 0,33 e Átomo 2: 0,15, 0,18, 0,22. Haverá um máximo da função de Patterson para o vetor interatômico, como segue: Átomo 1: 0,20, 0,31, 0,33 Átomo 2: 0,15, 0,18, 0,22 Pico do mapa de Patterson: u = x 1 x 2 = 0,20 0,15 = 0,05 v = y 1 y 2 = 0,31 0,18 = 0,13 w = z 1 z 2 = 0,33 0,22 = 0,11
Aplicação da Função de Patterson A função de Patterson permite a localização de átomos pesados em estrutura de cristais. Consideremos como exemplo um cristal de organometálico, onde temos um átomo de platina, como na estrutura do composto trans-dicloro[(trietilfosfina)(2- metilsulfinil)piridina)] platina (II), onde o átomo de platina está ligado a dois átomos de cloro e dois enxofres. O pico mais alto do mapa de Patterson dará indicação do vetor interatômico Pt-Pt, como só temos um átomo de platina, a distância será entre duas platinas relacionadas por simetria. Esta estrutura foi relatada por De Azevedo et al. 1995, o cristal é do grupo espacial P2 1 /c, onde temos átomos nas seguinte posições: H 3 C CH 2 CH 2 CH 2 CH 2 CH 2 S S O Pt O CH 2 CH 3 1) x, y, z 2) -x, -y, -z 3) -x, y+1/2, -z+1/2 4) x, -y+1/2, z+1/2 Cl Cl
Aplicação da Função de Patterson As distâncias entre os átomos, relacionados por simetria será dada por: Relação Diferença Coordenadas interatômicas A 1-2 ou 3-4 ±2x ±2y ±2z B 1-4 ou 2-3 0 ±2y± ½ ± ½ C 1-3 ou 2-4 ±2x ½ ±2z± ½ CH 2 CH 2 H 3 C CH 2 CH 2 CH 2 S S CH 2 CH 3 O Pt O Cl Cl Fonte: De Azevedo, W. F., Mascarenhas, Y. P., Sousa, G. F. and Filgueiras, C. A. L. Acta Crystallogr. Sect.C - Cryst. Struct. Commun., 51, 619-621, 1995.
Aplicação da Função de Patterson A partir dos dados de difração de raios X calculamos os picos do mapa de Patterson, que estão listados a seguir: Número do pico x y z 1 0,000 0,100 0,500 2 0,238 0,500 0,706 3 0,239 0,400 0,206... CH 2 CH 2 H 3 C CH 2 CH 2 CH 2 S S CH 2 CH 3 O Pt O Cl Cl Fonte: De Azevedo, W. F., Mascarenhas, Y. P., Sousa, G. F. and Filgueiras, C. A. L. Acta Crystallogr. Sect.C - Cryst. Struct. Commun., 51, 619-621, 1995.
Aplicação da Função de Patterson Considerando-se o pico 2, localizamos as coordenadas fracionárias x e z a partir da relação C, como segue: 2 x = 0,238 x = 0,119-2 z + 0,500 = 0,706 z = 0,603 Número do pico x y z 1 0,000 0,100 0,500 2 0,238 0,500 0,706 3 0,239 0,400 0,206... H 3 C CH 2 Cl CH 2 CH 2 CH 2 CH 2 O S Pt S Cl O CH 2 CH 3 Fonte: De Azevedo, W. F., Mascarenhas, Y. P., Sousa, G. F. and Filgueiras, C. A. L. Acta Crystallogr. Sect.C - Cryst. Struct. Commun., 51, 619-621, 1995.
Aplicação da Função de Patterson Considerando-se agora o pico 1, localizamos a coordenada fracionária y partir da relação B, como segue: -2 y + 0,500 = 0,100 y = 0,200 Número do pico x y z 1 0,000 0,100 0,500 2 0,238 0,500 0,706 3 0,239 0,400 0,206... CH 2 CH 2 H 3 C CH 2 CH 2 CH 2 S S CH 2 CH 3 O Pt O Cl Cl Fonte: De Azevedo, W. F., Mascarenhas, Y. P., Sousa, G. F. and Filgueiras, C. A. L. Acta Crystallogr. Sect.C - Cryst. Struct. Commun., 51, 619-621, 1995.
Aplicação da Função de Patterson A função de Patterson permite a localização de átomos pesados em estrutura de cristais de pequenas moléculas. Para macromoléculas biológicas sua aplicação restringe-se à determinação da posição de átomos pesados inseridos em cristais de proteínas, como será discutido no método de substituição isomórfica.
Método da Substituição Isomórfica Múltipla (MIR) A primeira estrutura de proteína resolvida foi a mioglobina em 1959. Essa estrutura foi resolvida por Kendrew e Perutz. Para a resolução da estrutura cristalográfica da mioglobina foi usado o método de substituição isomórfica múltipla. Este método usa uma abordagem reducionista para a solução do problema da fase. Podemos pensar no cristal de proteína como um mar, quase homogêneo, de densidade eletrônica. Num mapa como este, a inclusão de densidades eletrônicas maiores destacariam-se, no mar de densidade eletrônica. Tal efeito é obtido com a inclusão de metais pesados no cristal. Tal inclusão, permite a obtenção de informações iniciais sobre a fase, que permitem a solução do problema da fase. Num experimento típico de substituição isomórfica, coletamos dados de difração de raios X de um cristal nativo, sem metal pesado adicionado ao retículo cristalino, e outros conjuntos de dados com metais pesados adicionados ao retículo cristalino, chamados derivados isomorfos. Assim, temos pelo menos dois conjuntos de dados de difração de raios X: um nativo e outro com metal pesado.
Método da Substituição Isomórfica Múltipla (MIR) Chamaremos de F P o fator de estrutura do cristal nativo, sendo que este fator de estrutura apresenta fase α P. O fator de estrutura F PH é o fator de estrutura do derivado com metal pesado, que apresenta fase α PH. Vetorialmente temos que o fator de estrutura F PH é dado por: Eixo imaginário F PH = F P + F H Como ilustrado no diagrama. A F H B F P F PH Eixo real O
Método da Substituição Isomórfica Múltipla (MIR) Analisando-se o triângulo OAB temos: α P - α PH + [180 o ( α P - α H )] + γ = 180 o γ = α PH - α H. Pela lei dos cossenos temos: F PH 2 = F P 2 + F H 2-2 F P F H cos[180 o (α P - α H )] F PH 2 = F P 2 + F H 2 + 2 F P F H cos[(α P - α H )] α PH - α H F H cos[(α P - α H )] = ( F PH 2 - F P 2 - F H 2 ) 2 F P F H F P A α P - α H γ α H F PH B α P - α H = arcos ( F PH 2 - F P 2 - F H 2 ) [ ] 2 F P F H O α P α PH Eixo real
Método da Substituição Isomórfica Múltipla (MIR) Assumindo-se que medimos F PH e F P e que sabemos a posição dos átomos pesados na cela unitária do cristal, ou seja, podemos determinar F H e α H, temos que as fases dos fatores de estrutura da proteína α P são dados por: α P = α H + arcos Ou seja: [ ] ( F PH 2 - F P 2 - F H 2 ) 2 F P F H A F H α P - α H B γ α H α PH - α H α P = α H ± α F P F PH Há dois valores possíveis para α P O α P α PH Eixo real
Método da Substituição Isomórfica Múltipla (MIR) A ambiguidade na determinação da fase α P pode ser ilustrada graficamente seguindose um diagrama proposto por Harker em 1956. Como mostrado na figura abaixo. A construção de Harker é obtida da seguinte forma. Inicialmente traçamos o vetor F H a partir da origem O. O final do vetor F H determina a origem de A, de onde traçamos uma circunferência de raio F PH, desenhamos uma segunda circunferência de raio F P com centro em O. Há geralmente dois pontos de intersecção entre as duas circunferências, indicando a ambiguidade na determinação da fase α P. D F P O -F H A Eixo imaginário C F PH Eixo real
Método da Substituição Isomórfica Múltipla (MIR) Os vetores OB e OC indicam dois valores possíveis para o fator de estrutura da proteína nativa (F P ). Destacamos, que inicialmente só sabemos os módulos F P, F PH e a fase (α H ) e o módulo do fator de estrutura para o átomo pesado. Vimos anteriormente que: F PH = F P + F H (soma vetorial), como o objetivo é a determinação do vetor F P, assim isolando-se F P, temos: F P = F PH F H, esta é a razão de representarmos graficamente o F H na construção de Harker. D F P O -F H A Eixo imaginário C Eixo real F PH
Método da Substituição Isomórfica Múltipla (MIR) A informação do átomo pesado é obtida pelo método de Patterson. Para acabarmos a ambiguidade necessitamos de informação adicional, que pode ser obtida com a coleta de dados de raios X de um terceiro conjunto, com átomos pesados inseridos no retículo cristalino. Eixo imaginário F P = F PH F H F P C D O -F H A Eixo real F PH
Método da Substituição Isomórfica Múltipla (MIR) -F H2 A inclusão da informação, de um segundo derivado de átomo pesado, acaba com a ambiguidade na determinação do termo de fase. A circunferência referente ao F PH2 cruza a circunferência do F P em dois pontos (E e F), sendo que E coincide com C. Contudo, vale destacar, que o diagrama de Harker ilustra uma situação idealizada. Conjuntos de dados de difração de raios X reais F P Eixo imaginário C E apresentam erros, e tais erros podem ser interpretados como um D O circunferência com o traço espesso, que gera uma certa -F H Eixo real indeterminação no valor exato da A FPH2 fase, muitas vezes faz-se F PH necessário a coleta de vários derivados isomorfos, para a determinação da fase. F
Substituição Molecular O crescimento do número de estruturas de proteínas resolvidas gerou uma vasta base de dados estruturais, armazenadas no PDB (protein data bank) (www.rcsb.org/pdb). Partindo-se do pressuposto que proteínas que compartilham alta identidade na estrutura primária, apresentam o mesmo enovelamento, Rossmann propôs em 1962 um método onde as informações sobre a fase de uma proteína, com estrutura 3D desconhecida, mas que apresentasse estrutura primária similar com outra resolvida, poderia usar as informações estruturais da proteína resolvida como informação inicial. Tal método é chamado de substituição molecular.
Substituição Molecular O fluxograma a seguir ilustra o principais passos na resolução de uma estrutura de proteína a partir do método de substituição molecular. Para o uso do método da substituição molecular, recomenda-se realizar uma procura no PDB usando-se a sequência de aminoácidos da estrutura a ser determinada e selecionar, entras as estruturas resolvidas, a que apresentar mais alta identidade. Há outros fatores a serem considerados tais como: Resolução dos dados de difração do modelo, presença ou não de ligantes e estado oligomérico.
Substituição Molecular Arquivo PDB de proteína similar. Dados de difração de raios X da nova proteína (F obs ) Rotação e translação do modelo Cálculo do fator de Estrutura (F calc ) Cálculo do Coeficiente de Correlção Listagem da rotação, translação e CC
Substituição Molecular A procura de rotação e translação é uma busca com 6 graus de liberdades, se realizarmos as duas buscas concomitantemente teremos um alto custo computacional. Consideremos que temos 10 posições para cada ângulo e 10 posições para cada eixo de translação. Teremos neste caso 10 6 cálculos, dividindo-se em busca de rotação primeiro e em seguida a busca de translação teremos 10 3 cálculos para rotação e 10 3 cálculos para translação, ou seja, 2000 cálculos, uma redução considerável. Suponha que cada cálculo demore 1 s de CPU, para o cálculo dividindo-se a busca em rotação e translação teremos 2000 s, pouco mais de meia hora, para a procura concomitante teremos 1.000.000 de segundos 277,77 horas (mais de 11 dias!!!).
Substituição Molecular A partir das coordenadas atômicas podemos determinar os fatores de estrutura, usando-se a equação ao lado. F calc (hkl) = { [Σ f j cos (2π (hx j + ky j + lz j ) ] 2 { j=1 + N [Σ f j sen (2π (hx j + ky j + lz j ) ] 2 } 1/2 j=1 REMARK Written by O version 5.10.2 REMARK Sun Feb 25 14:05:51 1996 REMARK Walter F. de Azevedo Jr. CRYST1 72.307 73.069 54.284 90.00 90.00 90.00 ORIGX1 1.000000 0.000000 0.000000 0.00000 ORIGX2 0.000000 1.000000 0.000000 0.00000 ORIGX3 0.000000 0.000000 1.000000 0.00000 SCALE1 0.013830 0.000000 0.000000 0.00000 SCALE2 0.000000 0.013686 0.000000 0.00000 SCALE3 0.000000 0.000000 0.018422 0.00000 ATOM 1 CB MET 1 103.933 112.272 94.785 1.00 50.37 6 ATOM 2 CG MET 1 104.548 112.540 96.126 1.00 55.72 6 ATOM 3 SD MET 1 106.336 112.671 95.934 1.00 62.79 16 ATOM 4 CE MET 1 106.542 114.250 95.159 1.00 54.71 6 ATOM 5 C MET 1 103.199 114.420 93.762 1.00 47.20 6 ATOM 6 O MET 1 102.995 114.577 92.561 1.00 51.55 8 ATOM 7 HT1 MET 1 102.092 112.026 92.841 1.00 0.00 1 ATOM 8 HT2 MET 1 100.857 112.905 93.606 1.00 0.00 1 ATOM 9 N MET 1 101.710 112.330 93.759 1.00 48.54 7 ATOM 10 HT3 MET 1 101.467 111.494 94.328 1.00 0.00 1 ATOM 11 CA MET 1 102.732 113.140 94.479 1.00 47.79 6 ATOM 12 N GLU 2 103.906 115.275 94.503 1.00 44.44 7 ATOM 13 H GLU 2 104.333 114.933 95.316 1.00 0.00 1 ATOM 14 CA GLU 2 104.085 116.695 94.178 1.00 40.49 6 ATOM 15 CB GLU 2 104.531 117.459 95.428 1.00 43.49 6 ATOM 16 CG GLU 2 103.464 117.597 96.515 1.00 52.62 6 N X j + Y j + Z j
Substituição Molecular O coeficiente de correlação é um indicador estatístico, que assume valores próximos a 1 quando há correlação, e valores próximos a 0 quando não há correlação. Para seu uso em cristalografia, este é calculado usando-se os fatores de estrutura calculados (F calc ) e os fatores de estrutura observados (F obs ). Os F calc são obtidos diretamente das coordenadas atômicas do modelo de busca, e os F obs do experimento de difração de raios X. As coordenadas atômicas do modelo de busca são submetidas a rotações e translações. Para cada nova posição é calculado o F calc e um novo coeficiente de correlação. Esta informação é armazenada, assim no final temos uma listagem com as seguintes informações. Modelo alfa( o ) beta( o ) gama( o ) Tx Ty Tz CC 1 0 0 0 0 0 0 0,12 2 10 0 0 0 0 0 0,05...
Substituição Molecular O coeficiente de correlação é dado pela seguinte equação: CC = Σ ab (Σ a Σ b)/n { [ Σ a 2 (Σ a) 2 /N ] 1/2 } { [ Σ b 2 (Σ b) 2 /N ] 1/2 } Onde a = F obs e b = F calc
Substituição Molecular Para solução da estrutura, usando-se o método da substituição molecular, faz-se necessário somente um conjunto de dados de difração de raios X. Tal vantagem possibilita que a estrutura seja obtida de forma mais rápida que quando aplicamos o método de substituição isomórfica, contudo, nem sempre é possível aplicar-se o método de substituição molecular, mesmo quando há alta identidade entre a estrutura e o modelo de busca, as principais causas de insucesso do método de subsituição molecular são as seguintes: 3) Diferenças devido ao empacotamento cristalino 4) Diferenças devido ao estado oligomérico 5) Baixa qualidade estrutural do modelo de busca 6) Baixa qualidade dos dados de difração de raios X
Outros Métodos Há ainda dois outros método usados na solução do problema da fase: 3) Métodos diretos 4) Dispersão anômala
Referências Drenth, J. (1994). Principles of Protein X-ray Crystallography. New York: Springer- Verlag. Rhodes, G. (2000). Crystallography Made Crystal Clear. 2 nd ed.san Diego: Academic Press. Stout, G. H. & Jensen, L. H. (1989). X-Ray Structure Determination. A Practical Guide. 2nd ed. New York: John Wiley & Sons.