Поиск гомологов некодирующей нуклеотидной последовательности
1.Поиск и выбор т-РНК
Определите, какая тРНК была (скорее всего) использована рибосомой при присоединении 4-ого аминокислотного остатка к растущей цепи вашего белка.
Аминокислотный остаток в 4-ой позиции белка SYD_ECOLI |
E |
Соответствующий кодон в гене aspS |
5'-GAA-3' |
Идеальный антикодон |
5'-UUC-3' |
Сколько можно было бы ожидать разных тРНК для остатка E, если опираться на генетический код? |
Можно было ожидать 2
|
Сколько разных тРНК для остатка E аннотировано в геноме кишечной палочки? |
4 |
Характеристика выбранной для дальнейшего изучения тРНК: |
название гена |
gltV |
координаты гена в записи EMBL |
4207797..4207872 |
антикодон |
5'-UUC-3' |
Последовательность найденной тРНК из записи EMBL: |
gtccccttcgtctagaggcccaggacaccgccctttcacggcggtaacaggggttcgaat
cccctaggggacgcca
|
Использовавшиеся команды:
- для получения записей о тРНК глютаминовой кислоты в документе result.txt
grep "anticodon.*glutamate" ecoli.embl>result.txt
- для извлечения последовательности нужной тРНК
seqret ecoli.embl -sask
2.Поиск гомологичных тРНК в родственном геноме
Задача найти в геноме Sulfolobus solfataricus последовательность,
наиболее похожую на последовательность тРНК из E.coli, выбранную в упр. 1.
Поиск ведется с помощью 4-х разных программ для быстрого поиска сходных нуклеотидных последовательностей.
Таблица 2. Поиск гомологичной т-РНК
Программа |
FASTA |
BLASTN |
MegaBLAST |
Discontiguous MegaBLAST |
Число находок с E-value < 0,001 |
0 |
0 |
0 |
ничего не было найдено |
Характеристика лучшей находки: |
E-value находки |
0.0074 |
2.3 |
0.59 |
- |
Номер сектора генома |
21 |
72 |
72 |
- |
AC соответствующей записи EMBL |
AE006662 |
AE006699 |
AE006699 |
- |
координаты выравнивания(-ий) в записи EMBL |
7392-7459 |
3853-3865 |
3474-3457 |
- |
Аннотация лучшей находки по записи EMBL: |
tRNA-Val |
tRNA-SER |
tRNA-SER |
- |
Использовавшиеся команды:
- для создания БД по геному Sulfolobus solfataricus
formatdb -i ss_genome.fasta -n ss -p F
- для получения данных работы программы BLASTN
blastall -p blastn -d ss -i trna.fasta -o blastn.fasta
- для получения данных работы программы MEGABLAST
megablast -d ss -i trna.fasta -o megablast1_res.txt -e 10 -D 2 -W4
- для получения данных работы программы discontiguous MEGABLAST
megablast -d ss -i trna.fasta -o dmegablast.txt -e 10 -D 2 -W 11
- для получения данных работы программы fasta35
fasta35 trna.fasta ss_genome.fasta 6
При поиске программой MegaBLAST использовалась длина слова 4 bp,
при этом результаты абсолютно совпадали с результатами при поиске программой BLASTN.
При стандартной длине слова 28bp ничего не было найдено.
Результаты:
В геноме Sulfolobus solfataricus не было обнаружено подходящих последовательностей, сходных с тРНК глютаминовой кислоты E.coli.
Ни одна из трех представленных программ BLAST (будь то BLASTN, MegaBLAST или discontiguous MegaBlast) не позволяют вести поиск гомологов нуклеотидных последовательностей, так как все три не предназначены для этого. Каждая из них имеет низкую чувствительность, не имеет матриц замен, большие длины слов не позволяют находить эволюционные изменения нуклеотидных последовательностей. А так как в задании предлагалось найти гомологов у архебактерии, то тут дело обстояло гораздо сложнее. Да и программа FastA тоже не отличается хорошим поиском, однако у нее присутствует хоть какая-то матрица замен.
Но-как видно из результатов, гомологов эта программа находить хорошо все же не в состоянии.
На главную
На страницу третьего семестра
©Вахрушева Анна Алексеевна