C помощью команды entret sw:P27251 -auto я получила файл с записью SwissProt, в поле DR которого была информация о соответсвующих записях EMBL.
Всего 9 записей. Для выполнения задания я выбрала записи с AC X63666 и U18997.
С помощью команды entret embl:(здесь AC) -auto мне удалось извлечь не все записи, например, записи с AC
U00096, AE005556 и AP002564 не были найдены. Изучив выбранные две записи EMBL, я обнаружила, что в поле FT нет информации о моём белке def_Ecoli (P27251).
Используя следующие ссылки, я заметила, что данный мне AC белка является вторичным, а основной AC моего белка - P0A6K3.
Вот эти ссылки:
www.expasy.org/uniprot/P0A6K3
www.expasy.org/cgi-bin/get-entries?disp=1&AC=P27251
ecuw67 | ecfmt | |
---|---|---|
ID | ECUW67 | ECFMT |
AC | U18997 | X63666 |
Тип молекулы | геномная ДНК | геномная ДНК |
Длина последовательности в записи | 372438 нуклеотидных остатков | 2256 нуклеотидных остатков |
Раздел банка | прокариоты | прокариоты |
Начало гена в записи | 214437 | 54 |
Конец гена в записи | 214946 | 563 |
Направление гена | прямое | прямое |
Дата последнего изменения документа | 17.04.05 | 18.04.05 |
Из записей U18997 и X63666 были извлечены последовательности, которые кодируют белок def_Ecoli. Сохранены соответственно в следующих файлах: ecuw67_gene1.fasta и ecfmt_gene2.fasta. После выравнивания с помощью программы needle, было установлено, что идентичность составляет 100%. Результат выравнивания сохранен в gene1_gene2.needle. Само выравние я решила привести ниже.
ECUW67 1 atgtcagttttgcaagtgttacatattccggacgagcggcttcgcaaagt 50 |||||||||||||||||||||||||||||||||||||||||||||||||| ECFMT 1 atgtcagttttgcaagtgttacatattccggacgagcggcttcgcaaagt 50 ECUW67 51 tgctaaaccggtagaagaagtgaatgcagaaattcagcgtatcgtcgatg 100 |||||||||||||||||||||||||||||||||||||||||||||||||| ECFMT 51 tgctaaaccggtagaagaagtgaatgcagaaattcagcgtatcgtcgatg 100 ECUW67 101 atatgttcgagacgatgtacgcagaagaaggtattggcctggcggcaacc 150 |||||||||||||||||||||||||||||||||||||||||||||||||| ECFMT 101 atatgttcgagacgatgtacgcagaagaaggtattggcctggcggcaacc 150 ECUW67 151 caggttgatatccatcaacgtatcattgttattgatgtttcggaaaaccg 200 |||||||||||||||||||||||||||||||||||||||||||||||||| ECFMT 151 caggttgatatccatcaacgtatcattgttattgatgtttcggaaaaccg 200 ECUW67 201 tgacgaacggctagtgttaatcaatccagagcttttagaaaaaagcggcg 250 |||||||||||||||||||||||||||||||||||||||||||||||||| ECFMT 201 tgacgaacggctagtgttaatcaatccagagcttttagaaaaaagcggcg 250 ECUW67 251 aaacaggcattgaagaaggttgcctgtcgatccctgaacaacgtgcttta 300 |||||||||||||||||||||||||||||||||||||||||||||||||| ECFMT 251 aaacaggcattgaagaaggttgcctgtcgatccctgaacaacgtgcttta 300 ECUW67 301 gtgccgcgcgcagagaaagttaaaattcgcgcccttgaccgcgacggtaa 350 |||||||||||||||||||||||||||||||||||||||||||||||||| ECFMT 301 gtgccgcgcgcagagaaagttaaaattcgcgcccttgaccgcgacggtaa 350 ECUW67 351 accatttgaactggaagcagacggtctgttagccatctgtattcagcatg 400 |||||||||||||||||||||||||||||||||||||||||||||||||| ECFMT 351 accatttgaactggaagcagacggtctgttagccatctgtattcagcatg 400 ECUW67 401 agatggatcacctggtcggcaaactgtttatggattatctgtcaccgctg 450 |||||||||||||||||||||||||||||||||||||||||||||||||| ECFMT 401 agatggatcacctggtcggcaaactgtttatggattatctgtcaccgctg 450 ECUW67 451 aaacaacaacgtattcgtcagaaagttgaaaaactggatcgtctgaaagc 500 |||||||||||||||||||||||||||||||||||||||||||||||||| ECFMT 451 aaacaacaacgtattcgtcagaaagttgaaaaactggatcgtctgaaagc 500 ECUW67 501 ccgggcttaa 510 |||||||||| ECFMT 501 ccgggcttaa 510Cтруктура транслируемых участков человечкского гена NG36