Bioinformática Estrutural Aula 1 03 de Junho de 2013 Paula Kuser-Falcão Laboratório de Bioinformática Aplicada Embrapa Informática Agropecuária Paula.kuser-falcao@embrapa.br
Pratique Atividade Física Paula Kuser Falcão LBA/CNPTIA
Estrutura de Proteínas Sequence Structure Folding Protein desdobrada é uma cadeia de AA Protein dobrada A função depende da forma da proteína Altamente móvel Inativa Forma única Ordenada Estável Ativa Associações específicas Reações precisas
Relação estrutura - função Proteína: transferrina Função: transporte de ferro Extraído de: http://www.molmovdb.org/cgi-bin/movie.cgi
Estrutura Chave para entender a função Dinâmica Empacotamento cristalográfico Localização de mutantes Conservação de aa Carga e forma SNPs da superfície Estrutura Sítos ativos Sítos antigênicos Sítios na superfície Enovelamento Interação das Interfaces Grupos catalíticos Motivos Mecanismo Catalítico Relações de Evolução
Como uma estrutura de proteína parece?
Amino ácidos Componentes: Um átomo de carbono central (Cα) está ligado a um grupo amino (NH2), um grupo carboxila (COOH), átomo de hidrogênio (H), uma cadeia lateral (R).
Vinte Amino ácidos Os vinte aminoácidos variam em: tamanho, forma, carga, hidrofobicidade, capacidade de fazer ligações de hidrogênio, reatividade química, etc Esta variedade de propriedades leva à variação de funções que as proteínas possuem.
Fatos sobre os aminoácidos Glicina Pequena e simétrica, Frequentemente adota conformações não permitidas para aa maiores, Aumenta a flexibilidade da cadeia polipeptidica, Muito encontrada em voltas e loops, Frequentemente conservada por causa do seu tamanho e flexibilidade, Frequentemente terminam hélices, Comum em saliências beta, Mais comum em folhas beta grandes. Frequência: 7,4% 1inu
Fatos sobre os aminoácidos Alanina Pequena, Comum em hélices, Nem fortemente hidrofílica nem fortemente hidrofóbica, encontrada igualmente no interior e na superfície de proteínas, Aminoácido muito abundante. Frequência: 7,4 %
Fatos sobre os aminoácidos Cisteína Formação de pontes dissulfetos (rara em hélices alfa) Ligação de metais (Fe, Cu, Zn) Cys-livre gosta de estrutura secundária Cys-ligante gosta de loops Frequência: 3,3%
Pontes disulfeto Formam-se entre as cadeias laterais de duas cisteínas. Dois grupos SH de resíduos de cisteínas, que podem estar em partes diferentes da sequência de amino ácidos, mas adjacentes na estrutura tridimensional, são oxidados e formam um grupo disulfeto (S-
Fatos sobre os aminoácidos Serina e Treonina Cadeias laterais curtas Contém grupo OH Ser (S) Thr (T) Raras no meio de hélices alfa Comum na primeira volta de hélices alfa Ser comum em voltas beta, loops e regiões desordenadas Thr comum em folhas beta Sítios de fosforilização e glicosilização Frequência: 8,1% e 6,2%
Fatos sobre os aminoácidos Valina, Isoleucina, Leucina e Metionina Val, Leu e Ile-não reativos Normalmente encontrados no interior da molécula Menos flexíveis Normalmente encontrados em hélices alfa ou folhas beta
From Glycine to Leucine The Chemistry of Amino Acids University of Arizona http://www.biology.arizona.edu/biochemistry/problem_sets/aa/aa.html
Fatos sobre os aminoácidos Prolina Rígida, Comum em voltas, Quebrador de fitas, Quando se encontra no meio da hélice, a hélice fica dobrada. Colágeno - 1cag.pdb Frequência: 5,0 %
Fatos sobre os aminoácidos Ácido Aspártico (Asp) e Ácido Glutâmico (Glu) Aminoácidos ácidos, Envolvidos em pontes salinas, Envolvidos nas ligações de metais, Raramente encontrados no interior de proteínas, Se ligam a Ca2+, Comum na primeira volta de Frequência: 5,8% e 5,9% hélices
Sítio de ligação de Cálcio em Calmodulin
Fatos sobre os aminoácidos Lisina e Arginina Aminoácidos básicos Comum na última volta de hélices alfa Lys (K) Pontes salinas Raras no interior Lisina muito flexível, arginina mais rígida Ambas tem cadeias laterais com uma região hidrofóbica e uma cabeça Frequência: 7,2% e 4,2% carregada. Arg (R)
Fatos sobre os aminoácidos Histidina, Fenilanina, Triptofano Tirosina, Aminoácidos aromáticos Phe é altamente hidrofóbica, quase sempre no interior da molécula e normalmente em elementos de estrutura secundária Tyr é frequentemente envolvido em sítios de reconhecimento entre proteínas e seus receptores ou com ADN His é muito encontrada em sítios ativos e sítios de ligação de metais
Fatos sobre os aminoácidos Asparagina e Glutamina Asn (N) Gln (Q) Frequentemente formam ligações de hidrogênio com a cadeia principal, Cadeia lateral da Asn é capaz de imitar a ligação peptídica, Asn comum em voltas beta e incomum em estruturas secundárias, Asn comum no início de hélices alfa, Gln não têm uma preferência marcante para nenhum Frequência: 4,4% e 3,7% tipo de conformação.
Helpful Mnemonics para AA AA não polares FAMILY VW family volkswagen phenylalanine (F), alanine (A), methionine (M), etc... His Lies Are Basic Histidine Lysine and Arginine (basic amino acids)
Amino Acid Explorer NCBI http://www.ncbi.nlm.nih.gov/class/structure/aa/aa_explorer.cgi
Níveis de organização estrutural das proteínas Estrutura primária (sequência de aminoácidos) Estruturas secundárias e terciárias (relacionados ao enovelamento da cadeia polipeptídica) Estrutura quaternária (grupos de diferente cadeia polipeptídica)
Estrutura Primária A sequência ácidos MTATATEGAK APKGLFGVEC TEEKFEKVIN ANYAASKAGV GALQFIPAKR PPFVSRSVLV DVTDSDAVDR ANLTGAFRVA IGMARSIARE VGTPAEVAGV linear TGGNRGIGLA AFTAVEEHQG QRASRSMQRN LSKANVTANV VSFLASEDAS de IAQRLAADGH PVEVLVSNAG KFGRMIFIGS VAPGYIDTDM YISGAVIPVD amino KVAVTHRGSG LSADAFLMRM VSGSWGIGNQ TRALDERIQQ GGMGMGH-247
Enovelamento
Estrutura Secundária
Estrutura Secundária Hélice α Estrutura periódica os ângulos diedrais φ e ψ, possuem valores regulares e repetitivos em torno de -60 and -40 respectivamente. O grupo CO do aminoácido n faz uma ligação de hidrogênio com o grupo NH do aminoácido n+3 todos grupos CO e NH da hélice estão ligados por ligações de hidrogênio Tem 3.6 resíduos em cada volta de hélice.
Estrutura Secundária β-sheets São formadas quando partes da cadeia polipeptídica (fitas β) ficam próximas e formam ligações de hidrogênio entre os grupos CO and NH da cadeia principal. Paralelas Anti-paralelas
Turns e Loops Estruturas secundárias irregulares Para mudar de direção, a cadeia polipeptídica deve formar β-turn ou Ω-loop Beta Turn tipo 1
Principais forças que fazem uma proteína se enovelar Efeitos hidrofóbicos Pontes salinas Ligações de hidrogênio
Efeitos hidrofóbicos Principal força Resíduos apolares Amino ácidos hidrofóbicos, por não terem afinidade com a água, tendem a se agrupar no interior. Resíduos hidrofílicos, que têm afinidade com água, tendem a ficar na parte exterior da molécula. Resíduos polares
Pontes salinas Interação entre resíduos carregados positivamente (Arg, Lys and His) e carregados negativamente (Asp e Glu). Normalmente ocorrem na superfície.
Ligações de hidrogênio Alguns átomos, especialmente N e O, pode capturar elétrons de ligações de hidrogênio criando um sistema parcialmente carregado, chamado dipolo. Estes dipolos podem interagir com cargas opostas Podem ocorrer: Entre átomos da cadeia principal Entre átomos da cadeia lateral Entre átomos da cadeia lateral e cadeia principal Entre átomos de água Ligação de hidrogênio
α-hélice Ocorre ligações de hidrogênio entre todos os C=On e NHn+4 ao logo da hélice. A cadeia peptídica forma uma espiral mão direita.
Folha-β Apresentam padrão repetitivo de ligação de hidrogênio entre as cadeia principais.
Motivos Pequenos grupos de estruturas secundárias se agrupam para formar padrões (motivos).
Motivos Alguns exemplos simples são: helix-turn-helix motif, helix-turn-helix beta hairpin (duas fitas beta anti-paralelas ligadas por uma alça) beta-alpha-beta (duas fitas paralelas são ligadas por uma única alfa-hélice). Essas unidades são encontradas em muitas proteínas com funções diferentes, e pode não ter beta-alpha-beta beta hairpin
Estrutura Fold Conjunto estruturas Terciária = de diferentes secundárias
Estrutura Terciária: domínios Um domínio é definido como uma unidade compacta globular dentro de uma proteína, e é estável como uma unidade independente. Uma cadeia de proteína pode conter um ou mais domínios. domínio N domínio C A determinação exata do domínio é subjetiva. Os domínios geralmente têm funções específicas: em uma enzima multi-domínios, um domínio o domínio catalítico conterá a maioria ou mesmo todos os resíduos do sítio ativo. 1bol-human lactoferrin
Estrutura Quaternária
Parâmetros estruturais: ângulos diedros
Phi φ e Psi ψ A forma da proteína é determinada pela sua cadeia principal. Duas ligações são responsáveis pela forma. Os ângulos diedros dessas ligações são quem determinam a conformação.
Conformação da Cadeia Principal As ligações da cadeia polipeptídica entre N e Cα, e entre Cα e C, são ligações simples. As rotações em torno dessas ligações são limitadas pelo impedimento estérico que pode ocorrer na conformação.
Conformação da Cadeia Principal Diagrama de Sasikharan-Ramkrishan-Ramachandran A conformação da cadeia principal de cada resíduo é determinada pelos ângulos φ e ψ. Existem duas regiões principais permitidas: uma próximo de φ = -57 and ψ = -47 (α) e a outra próximo de φ = -125 e ψ = +125 (β).
Branco = conformação estericamente desfavorável. Vermelho = conformação estericamente muito favorável. Amarelo = conformação estericamente favorável.
CATH Protein Structure Classification Classificação de domínios de proteínas. Os domínios são agrupados em quatro níveis principais: Class Architecture Topology Homologous superfamily
Classe nível C conteúdo de estrutura secundária: mainly α, mainly β, α β, baixo conteúdo de estrutura secundária. Arquitetura - nível A orientação das estruturas secundárias, independente da conectividade. Topologia nível T agrupa estruturas de acordo com as conexões
PROTEIN DATA BANK - PDB http://www.rcsp.org/pdb http://pdb.rcsb.org
Potencial Eletrostático Pode ser usado como ferramenta na análise da estrutura e função da proteína. Interações eletrostáticas governam as interações entre proteínas e ligantes, são importantes na determinação da estabilidade das proteínas, mapeamento de canais, etc. Demonstra a afinidade de determinadas regiões da superfície da proteína por determinados tipos de carga positiva ou negativa.
Arquitetura de Domínios (1) Proteína com um domínio (2) Proteína Multi-domínios Domínio A B C D Proteoma Procarioto: 2/3 proteínas têm > 2 domínios Proteoma Eucarioto: 4/5 proteínas são multi-domínios