Изучить опции команды getorf можно здесь. Чтобы запустить программу getorf так, чтобы получить набор трансляций всех открытых рамок данной последовательности длиной более 30 нуклеотидов, считая открытой рамкой последовательность триплетов, начинающуюся со старт-кодона и заканчивающуюся стоп-кодоном , при использовании бактериального кода, необходимо выполнить кманду
getorf -sequence d89965.entret -table 11 -minsize 30 -find 1
Запустили getorf с указанными параметрами на последовательности из записи D89965. В результате получили файл. Всего было найдено 13 рамок. Из найденных открытых рамок 5-я соответствует приведённой в записи CDS, 13-я рамка соответствует записи Swiss-Prot, на которую ссылается данная запись EMBL.
запустили программу blastn, указав в качестве последовательностей для поиска файл trna_ecoli.fasta (обозначен новой переменной "genome" для удобства работы в putty, в качестве банка - все три генома и установив табличный формат выдачи:
megablast -d new -i "$genome" -o megablast.out -m 9
а затем разрывный ("discontigous") megablast
megablast -d new -i "$genome" -o dis_megablast.out -m 9
-m 9 -D 2 -t 18 -W 11 -N 1
Чтобы запустить discontigous
megablast, нужно было явно указать правильные значения опций
соответствующая записи EMBL:
AC AE012187 AE008922 DE Xanthomonas campestris pv. campestris str. ATCC 33913, section 95 of 460 of the complete genome. OS Xanthomonas campestris pv. campestris str. ATCC 33913 ID AE012187_7; parent: AE012187 AC AE012187; AE008922; FT tRNA 1427..1500 FT /gene="XCC0878" FT /product="tRNA-Gly" FT /note="Found by tRNAscan"
Как видим данный участок проаннотирован как кодирующий tRNA-Gly, то есть программа BLASTN действительно нашла гомолога.
Вырезали гомологичный участок в отдельный файл. Выделили исходную последовательность также в отдельный файл. Выровняли две последовательности программой needle.