Вернуться на главную страницу

Семестры

Третий семестр

EMBOSS: пакет программ для анализа последовательностей

Задание №1

Упражнения на некторое команды EMBOSS

1.(seqret) Несколько файлов в формате fasta собрать в единый файл
Команда: seqret @list_seq.txt 1_seqret.fastaИмена исходных последовательностейРезультат
2.seqretsplit) Один файл в формате fasta с несколькими последовательностями разделить на отдельные fasta файлы
Команда: seqretsplit 1_seqret.fasta (можно еще -auto)Исходный файлРезультат: x13141.fasta x13142.fasta x13143.fasta x13144.fasta x13145.fasta x13146.fasta
3.(seqret) Из файла с хромосомой в формате .gb вырезать три кодирующих последовательности по указанным координатам "от", "до", "ориентация" и сохранить в одном fasta файле
Команда: seqret @cod_seq_3.txt 3_seqret.fastaФайл с последовательностью хромосомы Burkholderia cenocepacia Файл с указанием координат коодирующих участковРезультат
4.(transeq) Транслировать кодирующие последовательности, лежащие в одном fasta файле, в аминокислотные, используя указанную таблицу генетического кода. Результат - в одном fasta файле.
Команда: transeq x13141.fasta x13141.pep -table 0Исходный файлРезультат
5.(transeq) Транслировать данную нуклеотидную последовательность в шести рамках.
Команда: transeq x13141.fasta x13141_5.pep -table 0 -frame 6Исходный файлРезультат
6.(seqret) Перевести выравнивание и из fasta формате в формат .msf
Команда: seqret fasta::vyr_water_good.fasta msf::vyr_water_good.msfИсходный файлРезультат
7.(infoalign) Выдать в выходной поток число совпадающих букв между второй последовательностью выравнивания и всеми остальными (на выходе только имя последовательности и число)
Команда: infoalign vyr_water_good.fasta -only -idcount -name stdoutИсходный файл
8.(featcopy) Перевести аннотации особенностей в записи формата .gb в табличный формат .gff
Команда: featcopy sequence.gb sequence.gff > sequence.gffИсходный файлРезультат
9.(extractfeat) Из данного файла с хромосомой в формате .gb получить fasta файл с кодирующими последовательностями; (*) добавить в описание каждой последовательности функцию белка (из поля product)
Команда: extractfeat sequence.gb info.fasta -type CDS -describe productИсходный файлРезультат
10.(shuffle) Перемешать буквы в данной нуклеотидной последовательности; (*) проверить с помощью blastn сколько "достоверных" находок (с E-value < 0.1) найдется в нуклеотидном банке данных (запустите с порогом E = 10 - по умолчанию)
Команда: shuffle -o x13142_shuffled.fasta x13142.fastaИсходный файлРезультат
11.(cusp)Найдите частоты кодонов в данных кодирующих последовательностях
Команда: cusp info.fasta Codon_usage.cuspИсходный файлРезультат
12.(compseq) Найдите частоты динуклеотидов в данной нуклеотидной последовательности и сравните их с ожидаемыми
Команда: compseq x13143.fasta x13143.compseq -word 2 -calcfreqИсходный файлРезультат
13.(tranalign) Выровняйте кодирующие последовательности соответственно выравниванию белков - их продуктов
Команда: tranalign x1314_1-6.fasta vyr_1314_1-6.mfa vyr_x1314_1-6.fastaНевыровненые нуклеотидные последовательности Выровненные белковые последовательности (получены с помощью transeq и Jalview)Результат Однако возможно из-за того, что последовательности брались случайным образом, он записывает в выдачу пустой файл

Задание №2

С помощью blast2seq (выравние двух или более последовательностей) с алгоритмом blastn надо было получить карту локального сходства последовательностей двух геномов родственных бактерий.

Были выбраны следующие бактерии: Streptococcus suis SC84 (последовательность) и Streptococcus suis strain NSUI060 (последовательность).

У поолученного выравнивания (прямых цепей plus strand) оказались следующие параметры:

Ниже представлена получившаяся карта локального сходства (dot matrix view)

Синим выделены инверсии

В центре и справа зеленым выделены

вставки в Query(Streptococcus suis SC84) = делеции в Subject(Streptococcus suis strain NSUI060).

Сверху зеленым веделены наоборот вставки в Subject = делеции в Query.

Желтым выделена дуплекация в Subject (Streptococcus suis strain NSUI060)

© Матвейшина Елена, 2015