Главная страница > Третий семестр > Поиск гомологов некодирующей нуклеотидной последовательности  

Поиск гомологов некодирующей нуклеотидной последовательности


Поиск тРНК, участвовавшей в присоединении четвертого аминокислотного остатка белка pyrG E.coli в записи EMBL

Четвертым аминокислотным остатком белка PYRG E.coli является аспарагин. В записи EMBL он кодируется триплетом AAC.

Третья позиция кодона изолейцина является вырожденной, и он также может кодироваться триплетом AAT(здесь имеет место характерная для большинства кодонов вырожденность по третьему остатку). Известно, что количество всевозможных тРНК меньше количества кодонов. Это объясняется тем, что одна тРНК зачастую может связываться не с одним кодоном, а сразу с несколькими. Это достигается тем, что связывание первого и второго остатков кодона со вторым и третьим остатками антикодона очень специфично(т.е. имеют место только связи А-У и Г-Ц), а связывание третьего остатка кодона и первого остатка антикодона может отступать от этого принципа. Мне кажется здесь имеет смысл привести таблицу(преобразованная мной схема из [1]), отображающую варианты связывания тРНК с мРНК:

Таблица 1.

Третий нуклеотид антикодона тРНК
Взаимодействующие с ним нуклеотиды кодонов мРНК
Ц
Г
А
У
У
А , Г
Г
У , Ц
И(инозин)
У , Ц , А
 

И поэтому зачастую тРНК может связываться с кодонами, которые имеют одни и те же первые два остатка, а от третьего будет зависеть со сколькими типами кодонов будет связываться тРНК. Это обстоятельство может частично компенсироваться тем, что очень часто кодоны с различными третьими остатками кодируют одну и ту же аминокислоту(в этом и состоит суть вырожденности генетического кода).

Ввиду вышесказанного, можно предположить, что различные тРНК, связывающиеся с одними и теми же первыми двумя остатками кодона, будут очень похожи по структуре(и как мы в дальнейшем убедимся, это действительно так). Помимо аспарагина кодоны с первыми двумя основаниями АА могут кодировать лизин.

На сервере kodomo-count был произведен поиск всех тРНК, закодированных в геноме E. coli, чей антикодон комплементарен кодону аспарагина. Для этого была использована команда grep:

grep anticodon.*asparagine > asntrna

Результаты выполнения команды при приведены в Таблице 2. Найдены четыре аспарагиновые тРНК с антикодоном GUU.

Таблица 2.

Аминокислотный остаток в 4-ой позиции белка PYRG_ECOLI

Аспарагин (N)

Соответствующий кодон в гене pyrG

5'-AAC-3'

Идеальный антикодон

5'-GUU-3'

Сколько можно было бы ожидать разных тРНК для остатка изолейцина, опираясь на генетический код?

2

Сколько разных тРНК для остатка изолейцина аннотировано в геноме кишечной палочки?

4

Характеристика выбранной для дальнейшего изучения тРНК

Название гена
asnT
Координаты гена в записи EMBL
2042573-2042648 (прямая цепь)
Антикодон
5'-GUU-3'

Результат поиска всех изолейциновых тРНК у Escherichia coli K-12

FT /note="codons recognized: AAY; anticodon: GUU asparagine
FT /note="codons recognized: AAY; anticodon: GUU asparagine
FT /note="codons recognized: AAY; anticodon: GUU asparagine
FT /note="codons recognized: AAY; anticodon: GUU asparagine






Поиск гомологичных тРНК в геноме архебактерии

Поиск участков в геноме архебактерии Sulfolobus solfataricus, сходных с последовательностью гена аспарагиновой тРНК( trna_gen ), проводилось с помощью программ FASTA, BLASTN, MegaBLAST, discontiguous MegaBLAST. Для проведения поиска были созданы базы данных по геному Sulfolobus solfataricus:

Команда: formatdb -i ss_genome.fasta -p F -n ss

Результаты поиска отображены в Таблице 3.


Таблица 3.

Программа

FastA
BLASTN
MegaBLAST
Discontigous MegaBLAST

Число находок с e-value < 0.001

0
0 0 0

Характеристика лучшей находки

E-value
0.012
0.59 0.59 -
Номер сектора генома
12
233 233 -
АС соответствующей записи EMBL
AE006653
AE006874 AE006874 -
Координаты выравнивания в записи EMBL
4272-4391
2890-2877 2890-2877 -

Аннотация лучшей находки по EMBL

Название гена
-
-
-
-
Продукт гена
tRNA-Lys
Hypothetical protein Hypothetical protein -
Примечания
Содержит один интрон
AC UniProt - Q97V33 AC UniProt - Q97V33 -





Поиск с помощью FASTA

Команда: fasta35 trna_gen.fasta ss_genome.fasta 6 -o fastares.txt

Эта программа показала самый лучший результат(самое низкое E-value). Лучшая из находок оказалась лизиновой тРНК. Это не удивительно, поскольку как уже говорилось раньше: помимо аспарагина кодоны с первыми двумя основаниями АА могут кодировать лизин. Это говорит о невысокой консервативности генов аспарагиновых тРНК. FASTA для проведения локального выравнивания использует алгоритм Смита-Ватермана, который очень чувствителен, особенно при длине якоря в 6 bp. Такая небольшая длина якоря дает возможность искать гомологи гена(пусть и очень отдаленные) в любых геномах.

Поиск с помощью BLASTN

Команда: blastall -p blastn -d ss -i trna_gen.fasta -o blastn.txt

Эта программа показала плохой результат. Самое низкое E-value не у гена лизиновой тРНК, как в предыдущем случае, а у гена, кодирующего Hypothetical protein. Хотя аминокислотная последовательность последнего уже есть в банке UniProt. Длина якоря равна 11, что достаточно много для поиска гомологов в геноме столь отдаленных организмов. По данным результатам можно сделать вывод, что данная программа не очень подходит для поиска гомологов в геномах очень отдаленных организмов.

Поиск с помощью MegaBLAST

Команда: megablast -d ss -i trna_gen.fasta -W 14 -o megablast.txt

Длина якоря в MegaBLAST по умолчанию равна 28. Поиск с такой длиной якоря не дал результатов, что не удивительно. А при якоре в два раза меньшем результат был и ничем не отличался от результата программы BLASTN. Оно и понятно, потому что длина якоря слишком большая. Мне кажется MegaBLAST идеально подойдет для поиска гомологов в геномах близких организмов или точных копий последовательностей(возможно даже будет работать быстрее, чем BLASTN, т.к. за счет большей длины якоря работает быстрее).

Поиск с помощью Discontigous MegaBLAST

Команда: megablast -d ss -i trna_gen.fasta -t 16 -N 2 -W 11 -o dismegablast.txt

В отличие от MegaBLAST в данной программе задается еще один дополнительный параметр - длина паттерна. Здесь как и в MegaBLAST очень важна скорость, а не точность. Поиск с помощью этой программы не дал результатов. Видимо как и MegaBLAST, данная программа не предназначена для поиска гомологов в геноме столь отдаленных организмов.



[1] - Кузнецов С. Л., Мушкамбаров Н. Н. "Молекулярная биология"

© Алипер Александр Миронович