|
|||||||||||||||||||||||||||
|
Bases de Dados de Sequências de Nucleótidos Este módulo vai apresentar, através de exemplos, algumas das Bases de dados de sequências de nucleótidos de acesso livre na internet. Outra dificuldade quando se trabalha com estas Bases de dados são os diferentes formatos em que as sequências são apresentadas. Para além disso, como existem diferentes Bases de dados para a o mesmo tipo de informação surge muitas vezes a necessidade de procurar uma determinada sequência em vários locais. Europa: EMBL Nucleótide Sequence Database Ásia: DDBJ (DNA Data Bank of Japan) O tutorial que segue vai utilizar a Entrez como Base de dados exemplo. Mas é importante salientar que as 3 Bases de dados apresentadas acima estão sincronizadas excepto para sequências que foram adicionadas nas últimas 24 horas.
1. Abrir um programa de navegação na Internet como o "Microsoft Internet Explorer" ou o "Mozilla Firefox" (utilizado neste tutorial). Abrir o site da NCBI (National Center for Biotechonology Information), http://www.ncbi.nlm.nih.gov/Entrez/. O site da NCBI é um dos mais utilizados em trabalhos na área da Bioinformática. Apresenta muitos recursos de livre acesso nomeadamente várias Bases de dados bem como ferramentas para pesquisar e tratar os resultados obtidos nas nossas pesquisas. 2. Clicar em "All Databases" na barra azul indicada pela seta vermelha.
3. Digitar "Down Syndrome [Ti]"no campo de procura que se encontra à direita de "Search across databases", como indicado pela seta azul. Primir "Go".
4. Primir na Base de dados de sequências de nucleótidos "Nucleotide".
7. Escolher o gene PIGP. Nesta página temos um conjunto de informação muito variada sobre este gene: função, sinónimos (importante porque um gene pode muitas vezes ter muitos nomes diferentes) bibliografia e vários links para outras bases de dados. Ao ler o sumário podemos ter uma noção de qual o efeito potencial de existir uma cópia a mais deste gene em casos de Síndrome de Down. 8. Procurar o link com o nome NM 153682.2 que corresponde ao gene que estamos a observar. Ao clicar na sequência escolher opção GENBANK. Deverão observar a seguinte página. Estamos agora no base de dados "Nucleotide" uma vez que selecionamos uma sequência de DNA, neste caso o gene. A expressão NM_153682.2 corresponde ao código da sequência do gene e nesta página podes obter informação adicional detalhada sobre a sequência. Nesta caso diz-se que a sequência está anotada ("Anotation"). Para esta sequência também podemos escolher links relacionados com a sequência. Podemos consultar o artigo onde esta sequência foi originalmente publicada. Podemos também escolher outra Base de Dados, por exemplo a "OMIM", onde podemos verificar se esta sequência foi referenciada como estando relacionada com alguma doença. Quantos pares de bases tem esta sequência? Com esta opção a página de internet com a nossa sequência pode agora ser gravada em formato texto (txt) e com a informação neste ficheiro em formato FASTA. 12. Clicar em "Download" e escolher opção "FASTA", escolher "Abrir com" e indicar que quer abrir o ficheiro como o WordPad. 13. Clicar no menu "Ficheiro>Guardar como...". Escolher uma pasta para guardar o ficheiro e escolher um nome para o ficheiro. No exemplo demos o nome de "RCAN_sequence.txt". Clicar em Guardar.
Não é boa ideia utilizar o Microsoft Word pois este software normalmente adiciona formatações. Estas formatações podem depois alterar a forma como outros programas lêm a sequência de nucleótidos.Se abrir com o "bloco de notas", a sequência guardada no formato FASTA é apresentada numa forma contínua o que por vezes torna impossível a visualização mais correcta da sequência. O WordPad é o software mais adequado para guardar sequências e normalmente existe em todos os computadores. Agora vai utilizar esta sequência no módulo seguinte "Alinhamento de sequências"
|
||||||||||||||||||||||||||
© 2010 Bioinfosites Inc. All rights reserved. | |||||||||||||||||||||||||||