Главная страница > Третий семестр > Поиск гомологов некодирующей нуклеотидной последовательности
Четвертым аминокислотным остатком белка PYRG E.coli является аспарагин. В записи EMBL он кодируется триплетом AAC.
Третья позиция кодона изолейцина является вырожденной, и он также может кодироваться триплетом
AAT(здесь имеет место характерная для большинства кодонов вырожденность по третьему остатку). Известно, что количество всевозможных тРНК меньше
количества кодонов. Это объясняется тем, что одна тРНК зачастую может связываться не с одним кодоном, а сразу с несколькими.
Это достигается тем, что связывание первого и второго остатков кодона со вторым и третьим остатками антикодона
очень специфично(т.е. имеют место только связи А-У и Г-Ц), а связывание третьего остатка кодона и первого остатка антикодона может отступать от этого принципа.
Мне кажется здесь имеет смысл привести таблицу(преобразованная мной схема из [1]), отображающую варианты связывания
тРНК с мРНК:
Таблица 1.
|
|
|
|
|
|
|
|
|
|
Ввиду вышесказанного, можно предположить, что различные тРНК, связывающиеся с одними и теми же первыми двумя остатками кодона, будут очень похожи по структуре(и как мы в дальнейшем убедимся, это действительно так). Помимо аспарагина кодоны с первыми двумя основаниями АА могут кодировать лизин.
На сервере kodomo-count был произведен поиск всех тРНК, закодированных в геноме E. coli, чей антикодон комплементарен
кодону аспарагина. Для этого была использована команда grep:
Результаты выполнения команды при приведены в Таблице 2. Найдены четыре аспарагиновые тРНК с антикодоном GUU.
Таблица 2.
Аминокислотный остаток в 4-ой позиции белка PYRG_ECOLI |
|
Соответствующий кодон в гене pyrG |
|
Идеальный антикодон |
|
Сколько можно было бы ожидать разных тРНК для остатка изолейцина, опираясь на генетический код? |
|
Сколько разных тРНК для остатка изолейцина аннотировано в геноме кишечной палочки? |
|
Характеристика выбранной для дальнейшего изучения тРНК |
|
Название гена |
|
Координаты гена в записи EMBL |
|
Антикодон |
|
Результат поиска всех изолейциновых тРНК у Escherichia coli K-12 |
|
FT /note="codons recognized: AAY; anticodon: GUU asparagine |
Поиск участков в геноме архебактерии Sulfolobus solfataricus, сходных с последовательностью
гена аспарагиновой тРНК( trna_gen ), проводилось
с помощью программ FASTA, BLASTN, MegaBLAST, discontiguous MegaBLAST. Для проведения поиска были созданы базы данных по геному Sulfolobus solfataricus:
Команда: formatdb -i ss_genome.fasta -p F -n ss
Результаты поиска отображены
в Таблице 3.
Таблица 3.
Программа |
|
|
|
|
Число находок с e-value < 0.001 |
|
0 | 0 | 0 |
Характеристика лучшей находки |
||||
E-value |
|
0.59 | 0.59 | - |
Номер сектора генома |
|
233 | 233 | - |
АС соответствующей записи EMBL |
|
AE006874 | AE006874 | - |
Координаты выравнивания в записи EMBL |
|
2890-2877 | 2890-2877 | - |
Аннотация лучшей находки по EMBL |
||||
Название гена |
|
- |
|
- |
Продукт гена |
|
Hypothetical protein | Hypothetical protein | - |
Примечания |
|
AC UniProt - Q97V33 | AC UniProt - Q97V33 | - |
Команда: fasta35 trna_gen.fasta ss_genome.fasta 6 -o fastares.txt
Эта программа показала самый лучший результат(самое низкое E-value). Лучшая из находок оказалась лизиновой тРНК. Это не удивительно, поскольку как уже говорилось раньше: помимо аспарагина кодоны с первыми двумя основаниями АА могут кодировать лизин. Это говорит о невысокой консервативности генов аспарагиновых тРНК. FASTA для проведения локального выравнивания использует алгоритм Смита-Ватермана, который очень чувствителен, особенно при длине якоря в 6 bp. Такая небольшая длина якоря дает возможность искать гомологи гена(пусть и очень отдаленные) в любых геномах.
Команда: blastall -p blastn -d ss -i trna_gen.fasta -o blastn.txt
Эта программа показала плохой результат. Самое низкое E-value не у гена лизиновой тРНК, как в предыдущем случае, а у гена, кодирующего Hypothetical protein. Хотя аминокислотная последовательность последнего уже есть в банке UniProt. Длина якоря равна 11, что достаточно много для поиска гомологов в геноме столь отдаленных организмов. По данным результатам можно сделать вывод, что данная программа не очень подходит для поиска гомологов в геномах очень отдаленных организмов.
Команда: megablast -d ss -i trna_gen.fasta -W 14 -o megablast.txt
Длина якоря в MegaBLAST по умолчанию равна 28. Поиск с такой длиной якоря не дал результатов, что не удивительно. А при якоре в два раза меньшем результат был и ничем не отличался от результата программы BLASTN. Оно и понятно, потому что длина якоря слишком большая. Мне кажется MegaBLAST идеально подойдет для поиска гомологов в геномах близких организмов или точных копий последовательностей(возможно даже будет работать быстрее, чем BLASTN, т.к. за счет большей длины якоря работает быстрее).
Команда: megablast -d ss -i trna_gen.fasta -t 16 -N 2 -W 11 -o dismegablast.txt
В отличие от MegaBLAST в данной программе задается еще один дополнительный параметр - длина паттерна. Здесь как и в MegaBLAST очень важна скорость, а не точность. Поиск с помощью этой программы не дал результатов. Видимо как и MegaBLAST, данная программа не предназначена для поиска гомологов в геноме столь отдаленных организмов.
[1] - Кузнецов С. Л., Мушкамбаров Н. Н. "Молекулярная биология"
© Алипер Александр Миронович