Таблица 1. Выбор т-РНК
Аминокислотный остаток в 4-ой позиции белка COAE_ECOLI | I/Ile/Isoleucine |
Соответствующий кодон в гене coaE (возможная вырожденная позиция подчеркнута) | 5'-AUA-3' |
Идеальный антикодон (возможная вырожденная позиция подчеркнута) | 5'-UAU-3' |
Сколько можно было бы ожидать разных тРНК для остатка I, если опираться на генетический код? | 3: AUA, AUC, AUT. |
Сколько разных тРНК для остатка I аннотировано в геноме кишечной палочки? | 5 (среди них имеются все три возможные типа) |
Характеристика выбранной для дальнейшего изучения тРНК: | |
имя гена | ileY |
локализация гена в геноме | 2783784..2783859 |
распознаваемый кодон | AUA; |
антикодон | CAU |
Результат поиска всех изолейциновых тРНК у Escherichia coli K-12: FT /note="codons recognized: AUY; anticodon: GAU isoleucine FT /note="codon recognized: AUA; anticodon: CAU; isoleucine FT /note="codon recognized: AUA; anticodon: CAU; isoleucine FT /note="codons recognized: AUY; anticodon: GAU isoleucine FT /note="codons recognized: AUY; anticodon: GAU isoleucine |
Теперь мы попробуем с помощью четырех разных программ провести поиск гомологов
полученной в первом пункте последовательности в геноме
родственного к исходному организма Bacillus subtilis.
Для действия программ нам необходимы индексные файлы по геному сенной палочки, содержащемся
в документе bs_genome.fasta. Для этого используем команду:
formatdb -i bs_genome.fasta -p F -n bs.
Результаты работы приведены в таблице 2.
Таблица 2. Поиск гомологичных кодирующих участков в геноме родственного организма различными программами.
Программа | FASTA | BLASTN | MegaBLAST | discontiguous MegaBLAST |
Длина якоря | 6 | 11 | 28 | 11 |
Результаты поиска | В результате поиска мы получили наилучшую из всех программ находку по E-value и по длине выравнивания. | Результат поиска можно посмотреть здесь. На выходе получили 6 локальных выравниваний, правда с относительно высоким E-value даже у лучшей находки. | Программа ничего не обнаружила. | Выходной файл можно смотреть здесь. Он содержит 2 локальных выпавнивания. Причем лучшая находка здесь идентична лучшей находке в выходе с программы BLASTN. |
Число находок с E-value < 0,01 | 1 | 1 | 0 | 1 |
Характеристика лучшей находки: | ||||
E-value | 1.6e-11 | 2e-04 | - | 3e-06 |
длина выравнивания | 77 | 36 | - | 36 |
вес выравнивания | 61 bits | 40.1 bits | - | 46.1 |
координаты в геноме | 11462..11538 | 158420..158455 | - | 158420..158455 |
Аннотация лучшей находки по записи EMBL: | ||||
имя гена | trnO-Ile | trnB-Met3 | - | trnB-Met3 |
это тРНК? | да | да | - | да |
это тоже изолейциновая тРНК? | да | нет, метиониновая | - | нет, метиониновая |
Команды, использовавшиеся непосредственно для проведения поиска:
Подводя итоги необходимо отметить, что только программа FASTA в полной мере справилась с поставленной задачей, хоть ее вравнивание по качеству и не самое лучшее. Программы BLASTN и discontiguous MegaBLAST также обнаружили гомологичные тРНК, но не той аминокислоты. Вообще от них ожидались результаты получьше. Программа MegaBLAST не приспособлена для решения такого типа задач, которой от нее требовали, и мы убеждаемся в этом по результатам поиска.