FFUL 2010-2011 Modelação molecular O que é? Modelação Modelo Molecular Moléculas Simulação do comportamento de moléculas e sistemas moleculares Modelação Computacional
FFUL 2010-2011 Modelação molecular Descrição do Sistema (átomos e posições) - Cartesianas (x,y,z) - Internas (átomos descritos em função uns dos outros)
FFUL 2010-2011 Modelação molecular Propriedades estruturais RMN EPR Espectros Afinidades electrónicas Potenciais de ionização Energias/estabilidades Estados de transição Calores de formação, Combustão Energias de complexação Acidez, Basicidade (pka) Forças de ligação Efeitos de solvatação Cargas atómicas Energias Orbitais Entalpias, energia livre, etc
FFUL 2010-2011 Modelação molecular Descoberta de novos Fármacos Leva de anos a décadas e é muito dispendioso Tremendamente atractiva Reduz os custos da experiência Sinergia teoria/experiência EM GERAL É MUITO MAIS BARATO QUE A EXPERIÊNCIA
FFUL 2010-2011 Modelação molecular Combinações eficientes entre teoria e experiência - post facto (situações em que existem dúvidas na interpretação dos resultados já existentes) - a priori (optimização de um programa experimental) - experiências difíceis/perigosas (previsão de propriedades difíceis/perigosas de obter experimentalmente).
2010-2011 Modelação molecular Alguns métodos Mecânica Molecular Docking e Screening Virtual Monte Carlo Dynâmica Molecular Mecânica Quântica
Rita C. Guedes (rguedes@ff.ul.pt Gab. C.2.14), FFUL 2010-2011 Decisão chave Problema Que Metodologia usar??? Tamanho do sistema Tempo disponível
Rita C. Guedes (rguedes@ff.ul.pt Gab. C.2.14), FFUL 2010-2011 Docking
FFUL 2010-2011 Com o nº crescente de alvos terapêuticos, a necessidade de uma procura rápida de moléculas que se liguem/interajam com estes alvos é essencial no processo de Design de novos fármacos. Cada vez mais estruturas tridimensionais de proteínas estão disponíveis : cristalografia de raios-x espectroscopia NMR Modelação por homologia O uso de software que utilize esta informação em projectos de design de novos fármacos torna-se cada vez mais importante. O problema chave: prever complexos energeticamente favoráveis entre uma proteína e uma outra molécula (ligando). DOCKING MOLECULAR
FFUL 2010-2011 O docking molecular envolve a previsão da conformação e orientação do ligando num sítio de ligação alvo
FFUL 2010-2011 O docking de proteínas e ligandos ocupa um lugar especial no campo geral do docking devido às suas aplicações na medicina Docking: Proteína-proteína Proteína-DNA Proteína-ligando
FFUL 2010-2011 Um programa de docking é usado para gerar e colocar ligandos numa estrutura alvo (ou numa parte específica da estrutura, ex: sítio activo de uma enzima) numa grande variedade de posições e orientações (algoritmo de procura). De forma a identificar as conformações energeticamente mais favoráveis, cada conformação é avaliada (por uma função de scoring) com base na sua complementaridade com o alvo em termos de forma e de propriedades como por exemplo as propriedades electrostáticas. Um bom score (afinidade prevista) indica que a molécula é possivelmente um bom ligando.
FFUL 2010-2011 Algoritmos de Procura A determinação do modo correcto de ligação de um ligando num sítio activo envolve a procura (algoritmo de procura) da orientação e da conformação correctas. Vários graus de liberdade a serem tidos em conta na procura: Translaccional Vibracional Rotacional Internos
FFUL 2010-2011 Docking rígido as estruturas do receptor e do ligando são rígidas (aproximação usada pelos primeiros algoritmos de docking). O nº de translações e de rotações possíveis num cubo (10 Å) é de 3x10 9 (int. translação-0.5 Å, int. rotação 5º). Se forem testadas 10 posições por segundo, levaria 10 anos a testar todas as posições possíveis.
FFUL 2010-2011 Docking rígido as estruturas do receptor e do ligando são rígidas (aproximação usada pelos primeiros algoritmos de docking). Docking semi-flexível apenas a estrutura do ligando é flexível Docking flexível ambas as estruturas são flexíveis (flexibilidade da proteína é um dos grandes desafios dos dias de hoje no campo do docking)
FFUL 2010-2011 Funções de Scoring As funções de scoring são essencialmente funções matemáticas usadas para estimar a afinidade de um composto para com um receptor. Exemplos de funções de scoring: Potenciais Knowledge-based Esquemas de Interacções físicas Funções empíricas
FFUL 2010-2011 Funções de Scoring knowledge based Estas funções são derivadas usando estatísticas para as frequências de contacto e/ou distâncias interatómicas numa grande base de dados de estruturas cristalinas de complexos proteína-ligando. Assumem que apenas as interacções moleculares que se assemelham às da base de dados favorecem a ligação e aumentam a afinidade. As distribuições da frequência observadas são convertidas em potenciais de meia-força (mean-force) ou potenciais knowledgebased.
FFUL 2010-2011 Funções de Scoring Esquemas de interacções físicas Estas funções são baseadas no pressuposto de que a energia livre de ligação de um ligando ao sítio activo pode ser decomposta numa soma de contribuições individuais. ΔGlig = ΔGint + ΔGsolv + ΔGconf + ΔGmov A energia livre de ligação pode ser descrita como a soma das interacções receptor-ligando, a contribuição do solvente e das mudanças conformacionais e os movimentos da proteína e do ligando durante a formação do complexo.
FFUL 2010-2011 Docking: Programas Um razoável número de programas de docking estão actualmente disponíveis FlexX MOE GOLD Dock Autodock ICM Glide * Fig. retirada do artigo: Proteins: Structure, Function, and Bioinformatics 65:15-12 (2006)
FFUL 2010-2011 Programas de Docking: FlexX http://www.biosolveit.de/flexx/
FFUL 2010-2011 Programas de Docking: FlexX utiliza algoritmos de construção por incrementação (os ligando partem de um fragmento base). Após colocar o fragmento base em diferentes posições o ligando é construído por adição dos restantes componentes. Cada componente é adicionado de acordo com as condições predefinidas. A cada passo as interacções são avaliadas e as melhores soluções são seleccionadas de acordo com o score. Como função de score é utilizado o modelo das interacções moleculares desenvolvido por Böhm e Klebe e posteriormente uma função deste tipo ligeiramente modificada. Esta função tem em conta a perda de entropia por parte do ligando, as pontes de hidrogénio, as interacções iónicas, as interacções aromáticas e os contactos lipofílicos.
FFUL 2010-2011 Programas de Docking: GOLD http://www.ccdc.cam.ac.uk/products/product_flyers/gold_suite.pdf
FFUL 2010-2011 Programas de Docking: GOLD Utiliza algoritmos genéticos (mimetizam o processo de evolução através da aplicação de operadores genéticos a uma população de conformações de um determinado ligando). Os cromossomas do GOLD contêm 4 genes que correspondem à flexibilidade da proteína, à flexibilidade do ligando, às pontes de hidrogénio e às interacções lipofílicas, respectivamente. A partir da informação contida num cromossoma é gerada uma estrutura tridimensional (1º é gerada uma conformação do ligando aplicando as rotações das ligações codificadas no cromossoma, 2º a conformação é colocada na proteína). A energia resultante da interacção é a soma de 3 contribuições (energia das ligações de hidrogénio, energia interna do ligando, energia das interacções estéricas).
FFUL 2010-2011 Programas de Docking: GOLD No início de uma corrida de docking o tamanho e o sítio activo são definidos e é utilizado um algoritmo de detecção de cavidade para calcular a superfície acessível ao solvente com a qual o ligando pode interagir/ligar. A população de cromossomas evolui pela aplicação sequencial de operações genéticas (mutações, crossover e migrações). Para aumentar a eficiência do algoritmo e evitar uma convergência prematura a população é constituída por mais de 1 cromossoma (100 por defeito) e estão agrupados por ilhas (5 por defeito). Após a operação genética ocorrer os cromossomas resultantes são descodificados e o fitness da conformação associada é avaliado, se for melhor que o anterior este é substituído.
FFUL 2010-2011 http://www2.umdnj.edu/~kholodvl/tut/gold_tutorial.pdf
Rita C. Guedes (rguedes@ff.ul.pt Gab. C.2.14), FFUL 2010-2011
Docking Molecular Benzamidine binding to beta-trypsin (3ptb) http://mgl.scripps.edu/people/gmm/movies/index.html
Docking Molecular Docking do ligando XK-263 (Merck-Dupond) à protease HIV-1
Rita C. Guedes (rguedes@ff.ul.pt Gab. C.2.14), FFUL 2010-2011 A maior parte dos programas de docking consegue prever estruturas proteína-ligando com um rigor de 1.5 a 2 Å. Em 70% dos casos consegue prever correctamente a geometria de ligação. Porém uma melhoria destes resultados está para já posta de parte. Factores limitantes: funções de scoring, efeitos de solvatação, resolução das estruturas cristalográficas e claro, a flexibilidade das proteínas.
Rita C. Guedes (rguedes@ff.ul.pt Gab. C.2.14), FFUL 2010-2011 Interacções Receptor-ligando
Rita C. Guedes (rguedes@ff.ul.pt Gab. C.2.14), FFUL 2010-2011 As interacções receptor-ligando fornecem-nos a base fundamental para a compreensão do mecanismo de acção de todos os fármacos. É importante o conhecimento de propriedades determinantes: Reconhecimento receptor-ligando Especificidade Termodinâmica Cinética
Rita C. Guedes (rguedes@ff.ul.pt Gab. C.2.14), FFUL 2010-2011 As interacções receptor ligando são sempre caracterizadas por uma compensação entalpia-entropia nas quais um dos termos favorece e o outro termo desfavorece a ligação. Contribuições entálpicas: electrostáticas, ligações de hidrogénio e interacções de van der Waals. Contribuições entrópicas: perda de entropia rotacional e translaccional, perda de flexibilidade. O primeiro modelo de ligação receptor-ligando deve-se a Emil Fisher que propôs que a enzima e o respectivo substrato se mantinham ligados por um mecanismo de chave- fechadura (estruturas rígidas). A ligação pressupõe na realidade algum grau de mudança conformacional.
Rita C. Guedes (rguedes@ff.ul.pt Gab. C.2.14), FFUL 2010-2011 Propriedades físicas importantes na ligação Receptor-ligando 1. Estéricos 2. Electrostáticos 3. Ligações de hidrogénio 4. Efeito hidrofóbico 5. Entropia
Rita C. Guedes (rguedes@ff.ul.pt Gab. C.2.14), FFUL 2010-2011 Propriedades físicas importantes na ligação receptor-ligando Estéricos A complementaridade da forma é muito importante para a ligação uma vez que as sobreposições de átomos do ligando e do receptor são proibidas pelas repulsões electrónicas. As sobreposições resultam numa penalização da energia que normalmente se modela por 1 função de Lennard-Jones. Cavidades vazias na interface entre o ligando e o receptor são também energeticamente desfavoráveis. Normalmente estão hidratadas.
Rita C. Guedes (rguedes@ff.ul.pt Gab. C.2.14), FFUL 2010-2011 Propriedades físicas importantes na ligação receptor-ligando Electrostáticas Este tipo de interacções são de longo-alcance e variam com o inverso da distância. São especialmente importantes no reconhecimento molecular. Para cada molécula considera-se não uma carga total, mas também uma distribuição de carga (carga parcial em cada átomo). Energia electrostática: termo coulómbico. As interacções electrostáticas receptor-ligando podem ser avaliadas experimentalmente medindo a dependência das propriedades de ligação em função da força iónica e do ph. Muito importantes em interacções de moléculas muito carregadas
Rita C. Guedes (rguedes@ff.ul.pt Gab. C.2.14), FFUL 2010-2011 Propriedades físicas importantes na ligação receptor-ligando Ligações de hidrogénio Específicas, de curto-alcance. São tratadas como uma soma de termos coulómbicos. São críticas para a estrutura e interacções de macromoléculas biológicas. Contribuem para a especificidade das interacções receptor ligando. Podem ser mediadas por moléculas de água (doadores/aceitadores).
Rita C. Guedes (rguedes@ff.ul.pt Gab. C.2.14), FFUL 2010-2011 Propriedades físicas importantes na ligação Receptor-ligando Efeito hidrofóbico Descreve a preferência energética de superfícies moleculares não polares para interagirem com outras superfícies do mesmo tipo. É devido a efeitos entálpicos e entrópicos. São interacções atractivas de curto alcance muito importantes na afinidade receptor-ligando. Contribuí para a especificidade das interacções receptor ligando mas de uma forma geometricamente menos constrangida.
Rita C. Guedes (rguedes@ff.ul.pt Gab. C.2.14), FFUL 2010-2011 Propriedades físicas importantes na ligação receptor-ligando Entropia A ligação afecta a dinâmica molecular interna e isto afecta a entropia vibracional e a entropia dos rotameros. Quando se estabelece uma ligação entre 2 moléculas a região de interface torna-se mais organizada o que resulta numa penalização para a entropia. Esta variação pode ser estimada. Para optimizar as contribuições entrópicas os composto são normalmente desenhados como sendo relativamente rígidos e com poucas rotações de ligações.
Rita C. Guedes (rguedes@ff.ul.pt Gab. C.2.14), FFUL 2010-2011 Screening Virtual
Virtual Screening Consiste no uso de algoritmos de docking e funções de scoring para o teste e avaliação de bases de dados de compostos.
Virtual Screening Use of high-performance computing to analyze large databases of chemical compounds in order to identify possible drug candidates. W.P. Walters, M.T. Stahl and M.A. Murcko, Virtual Screening-An Overview, Drug Discovery Today, 3,160-178 (1998). Quando é usado? na decisão de qual a biblioteca/ série de compostos a sintetizar na decisão de quais os compostos a comprar a uma companhia externa
Virtual Screening O processo de screening 1. Preparação do alvo (p. ex: enzima, estrutura 3D) 2. Preparação da base de dados (Zinc ou outra, sd file) 3. Docking 4. Análise Post-docking 5. Escolha dos compostos para teste
O processo de screening Virtual Screening 1. Preparação do alvo (p. ex: enzima, estrutura 3D, PDB) 2. Preparação da base de dados (Zinc ou outra, sd file) SD file- structure data, este tipo de ficheiro foi desenhado para permitir movimentar um grande nº de moléculas e os dados a elas associados entre bases de dados. Contém as coordenadas, o tipo de átomo, a quiralidade e as ligações que estabelece (connectivity data/table). Conversores 2D-3D: Corina, Converter, OMEGA, Ligando: adição de hidrogénios, ajuste da protonação com o ph, minimização da energia.
Virtual Screening O processo de screening 1. Preparação do alvo (p. ex: enzima, estrutura 3D) 2. Preparação da base de dados 3. Docking 4. Análise Post-docking 5. Escolha dos compostos para teste
Casos de sucesso Virtual Screening
Bases de dados Zinc é uma base de dados, livre, de compostos que estão disponíveis comercialmente (8 milhões de Compostos) http://zinc.docking.org/
Bases de dados http://zinc.docking.org/
Bases de dados http://www.ccdc.cam.ac.uk/products/csd/ http://nci.cambridgesoft.com/ http://pubchem.ncbi.nlm.nih.gov/
Rita C. Guedes (rguedes@ff.ul.pt Gab. C.2.14), FFUL 2010-2011 Farmacóforo
Rita C. Guedes (rguedes@ff.ul.pt Gab. C.2.14), FFUL 2010-2011 Definição de farmacóforo: 1. Paul Ehrlich (1909) é o conjunto de átomos que 1 composto deve ter de forma a ser activo num determinado teste biológico. 2. Um farmacóforo 3D é definido como o conjunto de propriedades e a estrutura 3D que um composto deve possuir de forma a ser activo num determinado teste biológico. 3. IUPAC - "an ensemble of steric and electronic features that is necessary to ensure the optimal supramolecular interactions with a specific biological target and to trigger (or block) its biological response".
Rita C. Guedes (rguedes@ff.ul.pt Gab. C.2.14), FFUL 2010-2011 Trabalho pioneiro de Marshall tomou como ponto de partida o conceito de farmacóforo: a orientação espacial de uma colecção de características de uma molécula que tendem a conferir-lhe actividade biológica. Este tipo de procedimento é especialmente útil quando não existe estrutura de raio-x disponível do alvo, como é ainda hoje em dia a maioria dos casos. O processo de obtenção de 1 farmacóforo a partir de uma série de dados é iniciado com o input de uma série de moléculas teste. http://accelrys.com/products/discovery-studio/pharmacophores/
Rita C. Guedes (rguedes@ff.ul.pt Gab. C.2.14), FFUL 2007-2008 Farmacóforo gerado para representar os inibidores do vírus da hepatite C- dependentes das RNA polimerases. A hipótese consiste em 5 propriedades: one H-Bond donor (rosa), one H-bond acceptor (verde), one negatively ionizable group (azul escuro) and two hydrophobes (azul claro). Inibidor em sticks http://www.chembiotek.com/chembiotek-html/datasheet/pharmacophore.pdf
Rita C. Guedes (rguedes@ff.ul.pt Gab. C.2.14), FFUL 2010-2011 Uma razão para gerar um farmacóforo é usá-lo posteriormente para a descoberta de outros compostos com a mesma actividade. Procura numa base de dados por compostos não testados. Teste do farmacóforo (deve reconhecer moléculas activas e inactivas). O farmacóforo não representa uma molécula real é um conceito abstrato
FFUL 2010-2011 Modelação molecular Exemplo de um caso de sucesso AutoDock's role in Developing the First Clinically-Approved HIV Integrase Inhibitor Prof. J. Andrew McCammon and his colleagues used AutoDock and the Relaxed Complex Method to discover novel modes of inhibition of HIV integrase. Researchers at Merck Pharmaceutical Company have used McCammon's work to design new drugs that target integrase, which lead in October 2007 to the first clinically-approved HIV Integrase inhibitor: Isentress (raltegravir). Schames, J.R., R.H. Henchman, J.S. Siegel, C.A. Sotriffer, H. Ni, and J.A. McCammon, Discovery of a novel binding trench in HIV integrase. J Med Chem, 2004. 47(8): 1879-81.
FFUL 2010-2011 Modelação molecular Exemplo de um caso de sucesso Isentress: Raltegravir HIV-1 integrase - attractive yet unexploited target to the treatment of HIV infection. Lack of structural information about enzymeligand interactions. One crystal structure 1QS4.pdb (information was questionable!) There is a disordered flexible loop (Ile141- Asn144) whose structure couldn t be precisely determined. The actual binding site of IN was not understood. Only key residues were known.
FFUL 2010-2011 Modelação molecular Exemplo de um caso de sucesso Isentress: Raltegravir Relaxed Complex method was used to elucidate the binding modes of the 5CITEP inhibitor. Relaxed Complex method: scheme to take protein flexibility into account by docking flexible ligands to protein snapshots taken from a MD simulation.
Modelação molecular 1. MD simulations using the protein structure of the IN (subunit A) of 1QS4.pdb, with all crystallographic waters removed were run. 2. Snapshots from the simulation were taken from time to time. 3. The 5CITEP was docked to those MD snapshots using Autodock 3.0 program. 4. Docking studies revealed 2 predominant docked conformations. 5. To take advantage of the 2 positions into which 5CITEP docks, a series (10) of ligands were designed. 6. Design of ligands that bind to both binding sites. 7. Ligand structure were based in 5CITEP but with 2 keto-enol and tetrazole groups in all possible positions around a naphtalene spacer (butterfly compounds). 8. Docking of the ligands to different snapshots. FFUL 2010-2011
FFUL 2010-2011 Modelação molecular Conclusions: The structure of the HIV-1 IN in the vicinity of the active site were not known. Combining MD with flexible docking, was shown the existence of a new binding site. This new open protein conformation was apparently stable and this potentially important part of IN enzyme should be considered for drug targeting. Some of the butterfly compounds were able to take advantage of this new protein conformation.
Rita C. Guedes (rguedes@ff.ul.pt Gab. C.2.14), FFUL 2010-2011 Modelação por Homologia
Modelação por Homologia Um dos grandes objectivos da modelação de proteínas é a previsão de estruturas 3D de proteínas a partir da sua sequência de aminoácidos. A previsão da estrutura de proteínas assenta em 2 aproximações: - Modelação por homologia - Cálculos baseados em minimizações de energia (ab initio)
Modelação por Homologia Modelação por homologia: A metodologia mais promissora assenta na modificação de moléculas semelhantes (e com funcionalidade análoga) para as quais a estrutura já tenha sido elucidada. O resíduos são mudados na sequência de forma e provocarem efeitos mínimos na geometria e é feita uma minimização de energia da estrutura alterada
Modelação por Homologia O que precisamos de saber para modelar por homologia? 1. Sequência de aminoácidos da proteína que queremos modelar 2. Estrutura de pelo menos 1 proteína homóloga O que é uma proteína homóloga? Grande similaridade na sequência de aminoácidos com a proteína que queremos estudar.
Modelação por Homologia Modelação por homologia: Proteínas com funcionalidades e sequências análogas terão estruturas semelhantes Quando a homologia (da sequência) com uma proteína conhecida é elevada, a possibilidade de sucesso da modelação da estrutura desconhecida da proteína é grande.
Modelação por Homologia Passos para criar um modelo por homologia: identificar proteínas homólogas determinar a percentagem de homologia identificar regiões em que a estrutura se conserva e em que esta varia gerar as coordenadas para os resíduos que não se conservam refinar e avaliar a nova estrutura
FFUL 2010-2011 Programas de MH: Modeller http://www.salilab.org/modeller/
Rita C. Guedes (rguedes@ff.ul.pt Gab. C.2.14), FFUL 2010-2011
Rita C. Guedes (rguedes@ff.ul.pt Gab. C.2.14), FFUL 2010-2011
Rita C. Guedes (rguedes@ff.ul.pt Gab. C.2.14), FFUL 2010-2011
Rita C. Guedes (rguedes@ff.ul.pt Gab. C.2.14), FFUL 2010-2011
Rita C. Guedes (rguedes@ff.ul.pt Gab. C.2.14), FFUL 2010-2011
Rita C. Guedes (rguedes@ff.ul.pt Gab. C.2.14), FFUL 2010-2011
Rita C. Guedes (rguedes@ff.ul.pt Gab. C.2.14), FFUL 2010-2011