A estrutura tridimensional das proteínas O esqueleto covalente das proteínas possui um elevado número de ligações em torno das quais é possível rotação, resultando num enorme número de conformações moleculares. A maioria das proteínas biológicas possui uma estrutura tridimensional bem definida, chamda estrutura nativa, que corresponde a um pequeníssimo conjunto dentro de todas as possíveis conformações. A estrutura nativa é estabilizada por interacções fracas (não-covalentes), sendo apenas marginalmente estável ( G 20-65 kj/mol) Princípios fundamentais para a compreensão da estrutura nativa das proteínas: a) A ligação peptídica é rígida e planar b) Os resíduos hidrofóbicos preferem o interior não polar das proteínas c) O número de ligação de hidrogénio na proteína é maximizado G folding -20-65 kj/mol
Sequência->Estrutura Muitas protéinas adquirem a sua estrutura tridimensional espontâneamente (folding) Simulação do folding ubiquitina
Propriedades estruturais da ligação peptídica Aligação peptídica apresenta interacções de ressonância que lhe conferem um carácter de 40% ligação dupla: O efeito de ressonância favorece a conformação planar da ligação peptídica: A conformação cis da ligação peptídica é estéricamente menos favoravel e muito mais raramente observada em proteínas:
A cadeia polipeptídica é formada por uma sucessão de planos peptídicos Os ângulos de torsão φ (fi) e ψ (psi) descrevem a orientação relativa das planos peptídicos. Certos valores de φ (fi) e ψ (psi) não são possíveis, porque provocam interferência estérica
O diagrama de Ramachandran A conformação do esqueleto da cadeia polipeptídica pode ser descrito através da enumeração dos pares de valores φ e ψ para cada resíduo. Dá a esta tipo de representação o nome de diagrama de Ramachandran, em homenagem ao seu inventor. No diagrama, cada ponto representa um aminoácido. As regiões a verde são aquelas que não provocam impedimentos estereoquímicos Diagrama de Ramachandran da lisozima A conformação φ=ψ=0 não é permitida!
Zonas permitidas e proibidas do diagrama de Ramachandran As zonas a azul escuro são as possíveis sem sobreposição atómica, azul médio são as zonas permitidas indo ao limite extremo de sobreposição atómica, e a região a azul claro é accessível através da flexão dos ângulos e comprimentos de ligação Tipe de contacto Limite Normal Limite Extremo H H 2,0 1,9 H O 2,4 2,2 H N 2,4 2,2 H C 2,4 2,2 O O 2,7 2,6 O N 2,7 2,6 O C 2,9 2,7 N N 2,7 2,6 N C 2,9 2,8 C C 3,0 2,9
A glicina tem maior liberdade conformacional As regiões do diagrama de Ramachandran accessíveis à Glicina são maiores porque este resíduo não tem cadeia lateral! Glicina
A estrutura secundária das proteínas A estrutura secundária de um polímero é definida como a conformação local da sua cadeia principal. No caso particular das proteínas, este termo é geralmente usado para descrever os padrões regulares da geometria local da cadeia polipeptídica, tais como hélices, folhas e voltas (turns). A estrutura da hélice α e da folha β foramcorrectamente deduzidas por Pauling e Corey em 1951, ainda antes de se ter conseguido determinar a estrutura de uma proteína com detalhe atómico. Hélice α Folha β Volta (turn)
A hélice α Proposta em 1951 por L.Pauling and R.Corey para explicar os dados de difracção de raios X de fibras de proteína. A hélice α possui um número não-inteiro de resíduos por volta (3.6) A geometria ideal da hélice α produz ângulos de torsão φ = -57.8, ψ = -47.0, passo = 5.4 Å e elevação por resíduo = 1.5 Å O grupo carbonilo do resíduo na posição i forma uma ligação de hidrogénio com o grupo amina do resíduo na posição i+4 As ligações de hidrogénio possuem uma geometria próxima da ideal. O raio da hélice é suficientemente pequeno para permitr a ocorrência de contactos de van der Waals no interior As cadeias laterais de cada volta da hélice estão desfasadas em relação às das voltas contíguas, evitando contactos desfavoráveis A hélice alfa é a estrutura helicoidal mais frequente observada nas proteínas globulares, correspondendo a cerca de 30% dos resíduos nas proteínas de estrutura conhecida. O comprimento médio de uma hélice é aproximadamente 12 resíduos, mas chega a atingir os 50 resíduos.
A hélice α é uma hélice direita Hélice esquerda Hélice direita Hélice alfa
Exemplos de hélices α Albumina do soro humano (representação esquemática) Albumina do soro humano (representação atómica)
A folha β A conformação estendida da cadeia polipeptídica foi primeiramente sugerida nos anos 30, mas só observada nos anos 70 quando da resolução da estrutura da lisozima. A conformação em folha β foi prevista correctamente por Pauling e Corey em 1951 A unidade básica da estrutura β é uma cadeia extendida (semelhante uma hélice de período 2) com ângulos φ e ψ aproximadamente iguais a -120, +120. Ao contrario da hélice α, as ligaçãoes de hidrogénio não se formam localmente mas entre cadeias distintas, que podem ser paralelas ou antiparalelas. Folha β antiparalela Folha β paralela
A folha β é plissada Uma cadeia com ângulos fi e psi = 180 produz uma conformação completamente estendida, como uma fita plana: O desvio dos valore de fi e psi de 180 para cerca de 120 faz com que os planos peptídicos subam e descam alternadamente, num padrão plissado (pleated)
Estruturas β Imunoglobulina humana Folha β anti-paralela Cadeia β Folha β paralela Barril β β twist
Voltas (turns) As proteínas globulares têm estruturas compactas, obrigando a múltiplas voltas (turns) da cadeia polipeptídica e constituindo por isso cerca de 30% da estrutura destas proteínas. Os t volta β (β turn) Voltas As voltas β de tipo I e II são as mais comuns em proteínas, aparecendo a tipo I quase o dobro das vezes que a II. A volta tipo II tem sempre uma glicina como segundo resíduo. glicina
Estruturas secundárias regulares As estrutura secundárias regulares caracterizam-se por valores de ângulos φ e ψ aproximadamente constantes. Folha β anti-paralela Folha β paralela Poliglicina e poli L-prolina Colagénio Hélice α Hélice α invertida Hélice π Fita 2.2 7 Hélice 3 10 φ ψ ω Resíduos por volta Translacção por resíduo Folha β antiparalela -139 +125-178 2,00 3,40 Folha β paralela -119 +113 180 2,00 3,20 Hélice α direita -57-47 180 3,60 1,50 Hélice 3 10-49 -26 180 3,00 2,00 Hélice π -57-70 180 4,40 1,15 Poliprolina I -83-158 0 3,33 1,90 Poliprolina II -78 +149 180 3,00 3,12 Polyglicina II -80 +150 180 3,00 3,10
A estrutura terciária das proteínas A estrutura terciária das proteínas descreve o arranjo dos seus átmos no espaço tridimensional. Enquanto a estrutura secundária descreve a conformação local das proteínas, a estrutura terciária descreve a estrutura global, em que as interacções entre pontos muito afastados da cadeia são cruciais. Geralmente separam-se as proteínas em dois grupos, as proteínas fibrosas e as proteínas globulares: Proteínas globulares: são geralmente solúveis, possuem uma forma compacta (glóbulo), contendo diferentes combinações de elementos de estrutura secundária, e desempenham funções variadas tais como catálise enzimática, reconhecimento molecular, transmissão de sinais, etc Proteínas fibrosas: são geralmente insolúveis, possuem cadeias muito longas com repetição de um único motivo de estrutura secundária, desempenham papéis estruturais ou de motilidade... Proteína globular (mioglobina) Proteína fibrosa (colagénio)
A fibroína da seda A fibroína, produzida por aranhas e insectos, é uma proteína fibrosa constituída por cadeias β extendidas, e rica em Alanina e Glicina (estudos da sequência indicam a presença da unidade (-Gly-Ser-Gly-Ala-Gly-Ala-) n ) As folha β ficam sobrepostas em camadas com um empacotamento de Alaninas numa face e Glicinas na outra A as propriedades mecânicas da seda podem ser explicadas se considerarmos a sua estrutura: pequena extensibilidade: porque a cadeia β já é uma estrutura quase totalmente extendida flexibilidade: porque as forças entre camadas sucessivas são de natureza não-covalente (relativamente fracas) Bicho da seda Padrão de difracção de uma fibra seda
A α-queratina A α-queratina é o principal componente da camada externa da pele, bem com dos pelos, da lã, chifres e cabelo (cerca de 85% do conteúdo celular de proteína). As fibras de queratina apresentam uma hierarquia de organização estrutural, desde os filamentos intermediários do citoesqueleto até às moléculas individuais. A unidade molecular da queratina é um dímero, constituído por duas hélices α que se enrolam em torno uma da outra numa hélice esquerda (hélice de hélices ou coiled coil ) As hélices do dímero de queratina mantem-se unidas através de um padrão repetido de resíduos hidrofóbicos na face interior da cada hélice (a-b-c-d-e-f-g em que a e g são hidrofóbicos) Dímero de α-hélices da queratina (coiled coil)
Estrutura do cabelo
Propriedades mecânicas das α-queratinas A α-queratina é rica em pontes de dissulfureto que ligam cadeias adjacentes através de resíduos de cisteína. O número de ligações cruzadas entre cadeias (cross links) determina a rigidez das queratinas: α-queratinas duras contêm um elevado número de pontes de dissulfureto, α-queratinas moles um número mais reduzido. A elasticidade das fibras de lã e cabelo resulta da distensão da estrutura helicoidal das moléculas de α-queratina. O grau de distensão é limitado pelo número de pontes de dissulfureto entre cadeias. Agentes redutores como o mercaptoetanol podem ser usados para remover as pontes dissulfureto da α-queratina, tornando mais flexível. O processo pode depois ser invertido com a adição de um oxixdante. reduzir frisar oxidar Mecanismo da frisagem do cabelo
O colagénio O colagénio existe em todos os animais multicelulares e é a proteína mais abundante dos vertebrados. É uma proteína extracelular, presente em vários tecidos conectivos: tendão, cartilagem, ligamentoes, matrix orgânica do osso, matriz fibrosa da pele e vasos sanguíneos, córnea do olho. O colagénio é, tal como a α-queratina, uma hélice de hélices: três hélices, as cadeias α (não confundir com α-hélices!) enrolam-se numa superhélice direita, enquanto cada uma das cadeias a forma uma hélice esquerda Existem muitos tipos de colagénio nos vertebrados, mas a quase todos contêm cerca de 35% Gly, 11% Ala, 21% Pro + Hyp (hidroxiprolina). O colagénio contem percentagens variáves dos resíduos modificados 3-hidroxiprolina, 4-hidroxiprolina e 5-hidroxilisina.
Estrutura do colagénio Cada uma das hélices do colagénio é uma hélice esquerda com uma conformação semelhante à da poliprolina. As sequências de colagénio apresentam uma fórmula geral Gly-X-Y, em que X é frequentemente Prolina e Y Hidroxiprolina As hélices têm 3.1 resíduos por volta e uma elevação de 10 Å O grupo -NH de cada Glicina forma uma ligação de hidrogénio com o grupo X de uma das cadeias adjacentes Sequência da região terminal do colagénio bovino α1(i) Super hélice tripla do colagénio Interacçõe entre resíduos das 3 cadeias
Fibras de colagénio Cross links covalente entre cadeias de colagénio, por meio das hidroxilisinas
Proteínas globulares As proteínas globulares compreendem um grupo altamente diversificado de proteínas que existem, no seu estado nativo, na forma de um glóbulo compacto, de dimensões mais ou menos esferoidais. As proteínas globulares desempenham uma diversidade de funções, tais como enzimas, receptores, hormonas, anticorpos e transportadores. As proteínas globulares apresentam, geralmente uma variedade de elementos de estrutura secundária combinados de diversos modos. Dimensões da albumina do soro humano comparadas com uma cadeia extendida
Exemplo de proteína globular: a mioglobina A mioglobina foi a primeira proteína a ser conhecida com detalhe atómico - a sua estrutura foi determinada por difracção de raios X nos anos 50 por John Kendrew e colaboradores. A análise da estrutura da mioglobina deu a conhecer os princípios gerais de organização das proteínas globulares. A mioglobina tem 153 aminoácidos de comprimento e possui um grupo prostético, o grupo hémico. Formas de representação da estrutura terciária da mioglobina
Princípios da estrutura de proteínas globulares A localização das cadeias laterais varia de acordo com a sua polaridade: os resíduos hidrofóbicos têm preferência pelo interior, enquanto os carregados se encontram quase sempre à superfície e os resíduos polares podem aparecer, ocasionalmente, no interior. O interior das proteínas está densamente empacotado, As proteínas globulares podem conter α hélices e folhas β Os elementos de estrutura secundária organizam-se em estruturas supersecundárias As proteínas de maiores dimensões (>200) estão geralmente organizadas em domínios, unidades estruturais mais ou menos autónomas cuja dimensão não ultrapassa os 100-200 aa. Elements de estrutura supersecundária Domínio A Domínio B
Diversidade de estruturas das proteínas globulares
A estrutura das proteínas globulares é construida a partir de elementos simples
Classificação estrutural das proteínas As proteínas podem ser classificadas de acordo com o conteúdo em estruturas secundárias, defindo-se as seguintes classes: α : contendo apenas hélices alfa β : contendo apenas estruturas beta α/β : elementos beta e alfa, ocorrendo de forma alternada α+β: elementos alfa e beta ocorrendo em regiões separadas Dentro de cada classe definem-se folds, em que cada fold corresponde a um tipo particular de arranjo de elementos de estrutura secundária (por.exemplo o barril beta). Dentro de cada fold definem-se superfamílias, proteínas com caracteristícas estruturais mais semelhantes, mas geralmente com diversidade funcional. Finalmente, dentro de cada superfamília definimos famílias, conjuntos de proteínas de estrutura muito semelhante e geralmente com uma função biológica idêntica ou próxima. classe fold superfamília família