3 Семестр

Задание 1

С помощью команды seqret можно несколько файлов в формате fasta собрать в единый файл. Для этого был создан список mylist.txt, содержащий адреса исходных последовательностей. Далее с помощью команды:

seqret @mylist.txt sequences.fasta

был получен файл sequences.fasta.

С помощью команды seqretsplit можно один файл в формате fasta с несколькими последовательностями разделить на отдельные fasta файлы. В качестве исходного файла использовался файл sequences.fasta, полученный в прошлом пункте. С помощью команды:

seqretsplit sequences.fasta -auto

были получены отдельные файлы с последовательностями: WSWS2951_COI_F_C11_WSBS-Seq-1-08-15.fasta и WSWS2951_COI_R_C12_WSBS-Seq-1-08-15.fasta .

С помощью команды seqret можно из файла с хромосомой в формате .gb три кодирующих последовательности по указанным координатам "от", "до", "ориентация" и сохранить в одном fasta файле. Использовался файл sequences.gb. Далее был создан список list2.txt, в котором содержит координаты кодирующих последовательностей. С помощью команды:

seqret @list2.txt sequences2.fasta

были вырезаны соответствующие кодирующие последовательности по указанным координатам, каждая записана в файл: sequences2.fasta.

С помощью команды transeq можно транслировать кодирующие последовательности, лежащие в одном fasta-файле, в аминокислотные, используя указанную таблицу генетического кода, при этом результат — в одном fasta-файле. На вход команде подавался файл sequences2.fasta, полученный в предыдущем пункте:

transeq sequences2.fasta tran_sequences.fasta

Таким образом был получен файл tran_sequences.fasta, содержащий трансляции исходных последовательностей.

С помощью команды transeq можно транслировать данную нуклеотидную последовательность в шести рамках.

transeq sequenses2.fasta tran_sequence2.fasta -frame 6

В итоге был получен файл tran_sequence2.fasta, содержащий шесть трансляций данной нуклеотидной последовательности.

Задание 2

В этом задании надо было построить карту локального сходства для двух геномов и описать крупные эволюционные события на пути от общего предка.

Для карты локального сходства была выбрана бактерия Ruminiclostridium (Clostridium) thermocellum DSM 1313 из первого семестра и бактерия того же вида Clostridium thermocellum ATCC 27405. С помощью алгоритма blastn и blast2seq на сайте NCBI была построена карта локального сходства для выбранных бактерий.

По оси Х в качестве query отложена бактерия DSM 1313, по оси Y в качестве subject бактерия ATCC 27405.

Таблица параметров выравнивания геномов

Max score	Total score	Query cover	E-value	Ident	Identities
2.975e+05	1.069e+07	96%	0.0	99%	155397/155702(99%)

Предположим последовательности комплиментарны. Согласно карте локального сходства есть 1 крупное эволюционное событие - инверсия среднего куска ДНК. Она отмечена красным на рисунке.

Также на карте видны небольшие делеции/вставки в последовательностях. Они отмечены синим на рисунке.

EMBOSS

Задание 1

Задание 2