Módulos
 
Bases de Dados
Alinhamento de sequências
OMIM
Visualização de proteínas 2
Árvores Filogenéticas
 
 
 
 
 
 


Tecnologia Enzimática - Parte II
Modelação de proteínas

Nesta aula de bioinformática vamos aprender a trabalhar com algumas ferramentas básicas para executar modelação de proteínas.

O objectivo da modelação é, a partir de uma sequência proteica (estrutura primária da proteína) chegar à estrutura tridimensional (estrutura terciária ou quaternária) da proteína e obter um modelo.

Neste módulo vamos utilizar uma das formas de modelação, a modelação comparativa de proteínas. Neste tipo de modelação utilizamos como termo de comparação uma proteína cuja estrutura tridimensional já está determinada experimentalmente. A essa proteína chamamos molde ou"template".

Introdução

Nesta aula vão estudar uma enzima a sorbitol desidrogenase. Esta enzima é capaz de catalisar a reação de desidrogenação (oxidação) de um álcool numa cetona ou aldeído. No processo a coenzima NAD+ é reduzida a NADH.

Apesar de algumas das isoformas da sorbitol desidrogenase não serem específicas para um substrato, a maior parte tem como substrato principal o sorbitol (iditiol) que é oxidado a frutose (L-sorbose).

Esta enzima tem sido referenciada como estando implicada em situações de diabetes. Este facto tornou a sorbitol desidrogenase um alvo muito apetecível para a indústria farmaceutica. De facto esta enzima tem sido muito estudada embora ainda não exista nenhum resultado prático de utilização clínica (El-Kabbani et al, 2004).

Figura 1. Imagem da sorbitol desidrogenase humana com as suas 4 subunidades. Nesta estrutura é possível observar a conenzima NAD+ ligada à enzima.

Neste trabalho vamos utilizar para os nossos estudos bioinformáticos uma sequência de nucleótidos com o gene da sorbitol desidrogenase identificada num patogene eucarióta de plantas, o oómicete Phytophthora infestans.

Na primeira parte do trabalho vamos localizar e gravar a sequência de nucleótidos que queremos, depois vamos fazer a tradução desta sequência de nucleótidos para sequência de aminoácidos e finalmente vamos fazer a modelação desta sequência proteica e obter um modelo da nossa enzima sorbitol desidrogenase.

Parte 1. Localizar o artigo científico.

1. Procurar o artigo onde foi referenciado o gene da enzima sorbitol desidrogenase para a Phytophthora infestans. Ajuda: no site www.pubmed.com procurar o artigo utilizando como palavras chave a nome da enzima sorbitol dehydrogenase ((em inglês) e o nome do fungo Phytophthora infestans.

2. O artigo investiga, entre outras coisas, quais os genes que são expressos em maior quantidade quanto a Phytophthora infestans forma esporos quando comparado com o mesmo organismo em condições normais de não esporulação. Localize no artigo uma tabela onde estão referenciados todos os genes que são até 100x mais expressos em condições de esporulação.

3. Na tabela poderá verificar que, para cada gene expresso, foi feito uma pesquisa BLAST para termos uma noção aproximada inicial da sua função por comparação com outros genes cujas funções são conhecidas.
Alguns desses genes que foram mais expressos em situações de esporulação foram referenciados como sendo semelhantes a outros genes de outros organismos que se sabe expressarem sorbitol desidrogenase (ler novamente a frase com calma se ainda tivere dificuldade não hesite em chamar o professor). Destes genes encontre o mais expresso (mais acima na tabela) e aponte o nome.

4. O investigador que descobriu esse gene e publicou o artigo em principio terá dado entrada numa base de dados a essa sequência de nucleótidos. Pesquisar numa base de dados de nucleótidos com o nome desse gene.

5. Uma vez localizado gravar a sequência de nucleótidos do gene num ficheiro de texto em formato FASTA.

Parte 2. Introduzir a sequência no nosso programa favorito o CLC Free Workbench.

1. Instalar o programa "CLC free workbench 2.0" a partir do site www.clcbio.com ou a partir do CD fornecido pelo professor (se está a utilizar os computadores da escola passar para o passo seguinte).

2. Abrir o programa "CLC Free Workbench 2".


Ao abrir o programa pode observar a interface do utilizador com duas secções principais: a área de navegação indicada pela seta azul e a área de trabalho indicada pela seta vermelha.
A área de navegação é o local onde pode gravar e aceder a toda a informação de um determinado projecto incluindo a informação original e a informação uma vez analisada pelo software.
A área de trabalho é onde a informação de um determinado ficheiro pode ser observada graficamente e onde normalmente se manipula e analisa a respectiva informação.

3. Quando abre o programa normalmente aparece na área de navegação um projecto por "default". Neste tutorial vamos criar um projecto novo. Para isso clique em: "File>New>Project". Escolha um nome para o projecto, por exemplo "GHII_nome do aluno" e clique "Enter".

4. Clicar no botão "Import". Escolher a ficheiro com a sequência que gravou no passo anterior. Clicar em Select.

5. O programa deverá apresentar um aspecto como este. A sequência fica gravada na área de navegação (seta vermelha). Fazer duplo clique no nome da sequência para que esta apareça na área de trabalho (seta azul).

Repare que a sequência que importou é uma sequência de nucleótidos (apresentada pelo símbolo da hélice vermelha ao lado esquerdo do nome da sequência). Mas o objectivo do trabalho é modelar a estrutura da proteína a partir da sequência de aminoácidos. Precisamos de traduzir a sequência de nucleótidos para sequência de proteinas. É o que vamos fazer na etapa seguinte.

6. Clicar em "Toolbox>DNA Analysis>Translate to Protein".

7. Selecione a sequência que quer traduzir. Clicar "Next" e depois "Finish".

8. Deverá ficar com o programa com este aspecto.

A seta azul representa o resultado da tradução da sequência de nucleótidos (translation) para a respectiva ORF (Open Reading Frame) de sequências de aminoácidos. Como pode observar as sequências de proteínas são representadas com um símbolo verde. Pode arrastar o título da sequência (seta azul) para a pasta na área de navegação (seta vermelha) assim a sequência fica gravada nesta área.

9. Alterar os settings de visualização indicados pelas setas verdes até obter uma imagem como a seguinte. Dica: para visualizar as duas sequências em janelas diferentes clicar com o botão do rato do lado direito no nome da sequência onde está a seta vermelha e escolher "View>Split Horizontally".

Como era de esperar a sequência proteica traduzida tem 3 vezes menos unidades em relação à sequência de nucleótidos. É esta sequência proteica que vamos modelar para tentar prever a sua estrutura tridimensional.

10. Clique no botão do rato do lado direito em cimado nome da sequência de proteínas e escolher View as text.

 

Parte 3. Modelação de proteínas

1. Mantenher o programa "CLC free workbench 2" aberto. Abrir uma janela com o ExPASy Proteomics Server: http://us.expasy.org/.

Como já vimos na última aula, o site da Expasy tem disponíveis muitas ferramentas de bioinformática.

2. Clicar onde diz "Secondary and terciary structure prediction". Fazer scroll até encontrar a seguinte página.

3. Clicar em ESyPred3D (seta vermelha). Colocar o endereço email (seta vermelha) onde vai receber o resultado da modelação, uma descrição da sequência (seta azul) e fazer copy paste da sequência no espaço indicado pela seta verde. Clicar no botão "submit to server".

O EsyPre3D é um de vários servidores automáticos de modelação por homologia disponíveis na internet. Escolhemos este porque temos tido bons resultados na previsão da estrutura tridimensional de proteínas. Podemos fazer copy paste directo da sequência mesmo com os números pois o servidor ignora estes números o que nem sempre acontece com outros servidores. Também se pode fazer o upload directo de ficheiros texto com a sequência proteica.

4. Obtemos uma janela como esta. Clicar em "View Job Status".

5. Deverá obter uma janela semelhante a esta.

O servidor vai agora tentar prever a estrutura tridimensional da proteina na nossa sequência. Existem muitos servidores diferentes cada um com a sua estratégia de modelação. Este servidor vai primeiro procurar, de entre todas as estruturas já determinadas experimentalmente, aquela que tem maior homologia com a nossa e depois utiliza essa proteína como molde (template) para construir o modelo da nossa proteína.

Repare que ficamos em lista de espera. O tempo de modelação pode demorar. Da última vez que fizemos uma modelação neste servidor demorou 1 hora. Os resultados da modelação são enviados para o correio electrónico.

6. Como pode demorar o professor já enviou uma modelação realizada anteriormente para usarem na aula. Abrir mail. O mail terá um especto como este:

A seta vermelha indica um ficheiro em anexo com o nosso modelo no formato pdb (nosso já conhecido da última aula). A seta azul indica um segundo ficheiro em anexo, no formato .ali (com o alinhamento da nossa sequência (modelo) com a proteína molde. Pode guardar o ficheiro pdb para depois abrir o ficheiro no programa "swiss-pdb viewer".

7. Abrir o ficheiro no formato ali. Basta fazer duplo clique no anexo. O ficheiro abre em formato de texto.

A primeira de sequência é a nossa da sorbitol desidrogenase com 351 aminoácidos (seta vermelha). A segunda sequência é a proteína(molde) que o servidor considerou como sendo a mais homóloga da nossa que foi a "1PL8" (seta azul) e que tem 356 aminoácidos (seta verde).

8. Procurar a estrutura da 1PL8 da site do PDB (seta vermelha) com fizeram na última aula.

9. Deverá obter o seguinte resultado.

A proteína que o servidor utilizou como molde foi a sorbitol desidrogenase em humano (seta vermelha).

10. Faça "download" do ficheiro "PDB file" da "1PL8"

11. Abrir o programa Swiss-pdb viewer. Abrir os dois ficheiros pdb: O modelo (prot_32703014232209.pdb) e o molde (1PL8.pdb). Deverá ficar uma figura como a seguinte.

Repare que o nosso modelo e o molde estão sobrepostos. Torna-se difícil distinguir entre os dois. O nosso modelo tem uma só subunidade mas a sorbitol desidrogenase humana tem 4 subunidades. Temos que esconder 3 das subunidades e deixar só a subunidade que está sobreposta com o nosso modelo.
Temos então fazer algumas alterações para conseguirmos visualizar melhor o nosso modelo.

12. No "control panel" selecionar a proteína que pretende manipular. Neste caso manter a 1PL8.

13. Torne visível apenas a subunidade D. Remova as cadeias laterais dos aminoácidos de todas as cadeias. Torne visível o Zinco (Zn 402) e a coenzima NAD (NAD400) da subunidade D (não precisam de colorir os ligandos a laranja podem escolher outras cores!). Deverão ficar com o control panel desta forma.

14. A imagem obtida deverá ficar com na imagem seguinte:

Repare no local onde se liga a NAD (laranja)!

15. Vamos tentar destinguir melhor o modelo e o molde. Escolha no Control Panel o modelo (seta vermelha). No modelo remova todas as cadeias laterais. Deverá ficar com o control Panel como o seguinte.

16. A imagem deverá ficar como a seguinte.

Repare com conseguimos ver melhor o modelo da sorbitol desidroganase da Phytophtera Infestans e da sorbitol desidrogenase humana que serviu de molde. São tão parecidas que praticamente conseguimos inferir a posição da coenzima NAD no nosso modelo.

17. Vamos agora verificar a qualidade do nosso modelo. Para isso vamos observar o diagrama de Ramachandran do nosso modelo. Deverá obter uma imagem como a seguinte:

Perguntas:

Qual é a percentagem de aminoácidos nas zonas: permitidas, pouco permitidas e proibidas.

Estes valores são indicadores de um bom ou mau modelo de estrutura proteica?

Trabalho Prático

Tem de realizar uma modelação da(s) sequência(s) proteica(s) que o professor irá fornecer. Deverão enviar o resultado da modelação por mail ao professor na forma de ficheiro pdb em anexo. Deverão enviar também um ficheiro word com a resposta às duas perguntas anteriores.

Um prémio (a determinar) será atribuído à estrutura mais bonita e à estrutura mais informativa!!!


1(2)

 
© 2007 Bioinfosites Inc. All rights reserved.
Ái