1. Работа с программой getorf пакета EMBOSS
  2. Создали в своей директории файл с записью D89965 банка EMBL.

    Изучить опции команды getorf можно здесь. Чтобы запустить программу getorf так, чтобы получить набор трансляций всех открытых рамок данной последовательности длиной более 30 нуклеотидов, считая открытой рамкой последовательность триплетов, начинающуюся со старт-кодона и заканчивающуюся стоп-кодоном , при использовании бактериального кода, необходимо выполнить кманду

    getorf -sequence d89965.entret -table 11 -minsize 30 -find 1

    Запустили getorf с указанными параметрами на последовательности из записи D89965. В результате получили файл. Всего было найдено 13 рамок. Из найденных открытых рамок 5-я соответствует приведённой в записи CDS, 13-я рамка соответствует записи Swiss-Prot, на которую ссылается данная запись EMBL.

  3. Поиск некодирующих последовательностей программой BLASTN
  4. В файле P:\y07\Term3\EMBL\trna_ecoli.fasta лежат последовательности всех тРНК, проаннотированных в полном геноме E.coli K12. Ваша задача - определить, сколько гомологов каждой из тРНК, проаннотированных в полном геноме E.coli K12, находит программа BLASTN в трёх геномах бактерий Salmonella typhimurium LT2, Pasteurella multocida, Xanthomonas campestris.

    запустили программу blastn, указав в качестве последовательностей для поиска файл trna_ecoli.fasta (обозначен новой переменной "genome" для удобства работы в putty, в качестве банка - все три генома и установив табличный формат выдачи:

  5. Поиск некодирующих последовательностей программой megablast
  6. Повторили предыдущее задание, используя вместо BLASTN сначала обычный megablast,

    megablast -d new -i "$genome" -o megablast.out -m 9

    а затем разрывный ("discontigous") megablast

    megablast -d new -i "$genome" -o dis_megablast.out -m 9 -m 9 -D 2 -t 18 -W 11 -N 1 Чтобы запустить discontigous megablast, нужно было явно указать правильные значения опций "-t", "-W" и "-N"; где:


     

  7. Минимальный анализ результатов
  8. Bыбрали tRNA E.coli . Данная tRNA находится программой BLASTN геноме Xanthomonas campestris и не находится программой megablast. Это прежде всего связно со значением длины слова (11 у BLASTN и 28 у megablast). Программы находят наиболее оптимальный вариант вывнивания, путём нахождения слова в последовательности и дальнейшего его удлиннения в обоих направлениях с учётом штрафов за гэпы. Естественно, с таким большим значение слова, megablast ожет найти только очень близкие последовательности, тогда как BLASTN способен искать и более далёких гомологов.

    соответствующая записи EMBL:

    AC AE012187 AE008922
    DE Xanthomonas campestris pv. campestris str. ATCC 33913, section 95 of 460 of the complete genome.
    OS Xanthomonas campestris pv. campestris str. ATCC 33913
    ID AE012187_7; parent: AE012187
    AC AE012187; AE008922;
    FT   tRNA            1427..1500
    FT                   /gene="XCC0878"
    FT                   /product="tRNA-Gly"
    FT                   /note="Found by tRNAscan"
    

    Как видим данный участок проаннотирован как кодирующий tRNA-Gly, то есть программа BLASTN действительно нашла гомолога.

    Вырезали гомологичный участок в отдельный файл. Выделили исходную последовательность также в отдельный файл. Выровняли две последовательности программой needle.

    <Третий семестр

    <<Главная страница


    ©ХАЧАТРЯН ЛУСИНЕ, 2008