Главная страница

Поиск сходных нуклеотидных последовательностей, не кодирующих белки



1. Определение тРНК, использованной рибосомой при присоединении 4-ого аминокислотного остатка к растущей цепи белка

Четвертым остатком белка FABI_ECOLI является L (лейцин). В записи EMBL ему соответствует триплет CTG, а соответствующим кодоном в гене является CAG.
Всего лейцин кодируется шестью кодонами: TTA, TTG, CTT, CTC, CTA, CTG; т.е. можно ожидать существования шести тРНК. Соответствующие антикодоны - UAA, CAA, AAG, GAG, UAG, CAG.
Вырожденными позициями здесь являются первая и третья.
Идеальный антикодон можно записать как 5`-NAR-3` (любой из 4 нуклеотидов в первой позиции, А или G в третьей).

Для поиска лейциновых тРНК в документе EMBL используется команда

grep codon.*leucine ecoli.embl >leucine.txt

(в дальнейшем из найденных строк необходимо исключить относящиеся к изолейцину, которые также были найдены)

В геноме Escherichia coli для данного остатка существует 5 тРНК, последняя встречается четыре раза).

Аминокислотный остаток в 4-ой позиции белка FABI_ECOLI L (лейцин)
Соответствующий триплет в записи EMBL (кодон в иРНК) 5'-CTT-3'
Идеальный антикодон 3`-GAA-5`
Сколько можно было бы ожидать разных тРНК для остатка L, если опираться на генетический код? 6
Сколько разных тРНК для остатка L аннотировано в геноме кишечной палочки? 5
Характеристика выбранной для изучения тРНК:
имя гена leuW
локализация гена в геноме 696186..696270, комплементарная цепь
распознаваемый кодон CUR
антикодон UAG
Результат поиска всех лейциновых тРНК у Escherichia coli K-12
FT                   /note="codons recognized: CUR; anticodon: UAG leucine
FT                   /note="codons recognized: UUR; anticodon: UAA leucine
FT                   /note="codons recognized: CUY; anticodon: GAG leucine
FT                   /note="codon recognized: CUG; anticodon: CAG leucine tRNA1;
FT                   /note="codons recognized: UUR; anticodon: CAA leucine
FT                   /note="codon recognized: CUG; anticodon: CAG leucine tRNA1;
FT                   /note="codon recognized: CUG; anticodon: CAG leucine tRNA1;
FT                   /note="codon recognized: CUG; anticodon: CAG leucine tRNA1



2. Поиск гомологичных тРНК в родственном геноме.

Перед работой были созданы индексные файлы к БД:

format db –i bs_genome.fasta –p F –n bs

Далее был произведен поиск с помощью соответствующих команд.

FASTA:
fasta34 leuW.fasta bs_genome.fasta 6

BlastN:
blastall -p blastn -d bs -i leuW.fasta -o blastnres.txt

MegaBLAST:
megablast -d bs -i leuW.fasta -D 2 -o megablres.txt

Discontiguous MegaBLAST:
megablast -d bs -i leuW.fasta -D 2 -W 11 -t 21 -N 1 -o dismegablres.txt

Программа FASTA BLASTN MegaBLAST discontiguous MegaBLAST
Длина якоря 6 11 28 11
Результаты поиска более 20 находок 1 находка нет находок нет находок
Число находок с E-value<0,01 0 0 - -
Характеристика лучшей находки:
E-value 0,5 2,8 - -
длина выравнивания 30 13 - -
вес выравнивания 25,9 26 - -
координаты в геноме 8201-8230 187848-187836 - -
Аннотация лучшей находки по записи EMBL
имя гена resC prfA - -
это тРНК? нет нет - -
это тоже лейциновая тРНК? нет нет - -


Самым эффективным оказалось использование программы FASTA, давшее наибольшее количество находок с наименьшим E-value. Несмотря на это, E-value все же является достаточно большим (0,5), и существенность находок сомнительна. Программа BLASTN дала лишь один результат с еще большим E-value (2,8), вероятно, из-за большей длины якоря (это делает невозможным поиск гомологов, если сходство наблюдается на коротких участках последовательностей). Поиск с помощью MegaBLAST и discontiguous MegaBLAST не принес результатов (можно предположить, что с якорем длиннее 11 нуклеотидов результатов не будет).


©Сорочкина Александра