EMBOSS

Задание 1

С помощью команды seqret можно несколько файлов в формате fasta собрать в единый файл. Для этого был создан список mylist.txt, содержащий адреса исходных последовательностей. Далее с помощью команды:

  • seqret @mylist.txt sequences.fasta
  • был получен файл sequences.fasta.

    С помощью команды seqretsplit можно один файл в формате fasta с несколькими последовательностями разделить на отдельные fasta файлы. В качестве исходного файла использовался файл sequences.fasta, полученный в прошлом пункте. С помощью команды:

  • seqretsplit sequences.fasta -auto
  • были получены отдельные файлы с последовательностями: WSWS2951_COI_F_C11_WSBS-Seq-1-08-15.fasta и WSWS2951_COI_R_C12_WSBS-Seq-1-08-15.fasta .

    С помощью команды seqret можно из файла с хромосомой в формате .gb три кодирующих последовательности по указанным координатам "от", "до", "ориентация" и сохранить в одном fasta файле. Использовался файл sequences.gb. Далее был создан список list2.txt, в котором содержит координаты кодирующих последовательностей. С помощью команды:

  • seqret @list2.txt sequences2.fasta
  • были вырезаны соответствующие кодирующие последовательности по указанным координатам, каждая записана в файл: sequences2.fasta.

    С помощью команды transeq можно транслировать кодирующие последовательности, лежащие в одном fasta-файле, в аминокислотные, используя указанную таблицу генетического кода, при этом результат — в одном fasta-файле. На вход команде подавался файл sequences2.fasta, полученный в предыдущем пункте:

  • transeq sequences2.fasta tran_sequences.fasta
  • Таким образом был получен файл tran_sequences.fasta, содержащий трансляции исходных последовательностей.

    С помощью команды transeq можно транслировать данную нуклеотидную последовательность в шести рамках.

  • transeq sequenses2.fasta tran_sequence2.fasta -frame 6
  • В итоге был получен файл tran_sequence2.fasta, содержащий шесть трансляций данной нуклеотидной последовательности.

    Задание 2

    В этом задании надо было построить карту локального сходства для двух геномов и описать крупные эволюционные события на пути от общего предка.

    Для карты локального сходства была выбрана бактерия Ruminiclostridium (Clostridium) thermocellum DSM 1313 из первого семестра и бактерия того же вида Clostridium thermocellum ATCC 27405. С помощью алгоритма blastn и blast2seq на сайте NCBI была построена карта локального сходства для выбранных бактерий.

    По оси Х в качестве query отложена бактерия DSM 1313, по оси Y в качестве subject бактерия ATCC 27405.

    Таблица параметров выравнивания геномов
    Max score Total score Query cover E-value Ident Identities
    2.975e+05 1.069e+07 96% 0.0 99% 155397/155702(99%)

    Предположим последовательности комплиментарны. Согласно карте локального сходства есть 1 крупное эволюционное событие - инверсия среднего куска ДНК. Она отмечена красным на рисунке.

    Также на карте видны небольшие делеции/вставки в последовательностях. Они отмечены синим на рисунке.

    © Mishchenko Polina 2016