Учебная страница курса биоинформатики,
год поступления 2016
Подсказки
Для подсчета абс. функ. конс. позиций в выравнивании используйте python скрипт count-positives.py (ссылка со стр. term2 там где прак.10), а не infoalign.
Для запуска нужна матрица BLOSUM62, на нее ссылка тоже стоит. При запуске на kodomo ее можно не указывать в параметрах, т.к. по умолчанию используется матрица из EMBOSS.
Запустив скрипт без параметров узнаете как параметры задавать.
Исправления необходимо внести в отчет.
Импортируйте последовательности в JalView (в одном fasta-файле или по отдельности - Add sequence) и выровняйте (меню Web services). В Color, above identity threshold установите 100%. При этом только абсолютно консервативные позиции будут покрашены.
Для расчета параметров консервативности используйте команду infoalign пакета EMBOSS. infoalign рассчитывает консенсусную последовательность ( при -refseq 0, стоящем по умолчанию) и рапортует об отличиях каждой из последовательностей выравнивания от консенсуса.
Для абсолютно консервативных позиций укажите, что консенсус включает букву только в том, случае, когда позиция абсолютно консервативна ( -identity 100.0).
Для абсолютно функционально консервативных позиций укажите -plurality 100.0
Выводите в результат только (-only) колонки с именем последовательности, длиной последовательности, числом совпадений с консенсусом и числом а.к.о. сходных, но не совпадающих, с консенсусом. Используйте infoaligh -help -verbose чтобы получит подсказки по параметрам программы
Придумайте как посчитать остальные значения. В крайнем случае можно считать глазками, используя подходящую раскраску выравнивания.
Для разметки рядом с нижними строками conservation и др вызовите меню правой кнопкой мыши, вставьте новый ряд разметки. Выделите целиком нужную колонку и в ряду разметки правой кнопкой в меню выберите label и вставьте нужную букву
- Пусть ваша последовательность p.fasta.
- Внести семь точечных мутаций мутаций всех типов позволяет команда msbar пакета EMBOSS. Используйте параметры:
- число мутаций (-count 7)
- все типы точечных мутаций (-point 1)
- блоковых, т.е. крупных, мутаций нет (-block 0)
- конечно, входная последовательность и резудьтат
Проведите семь раундов мутаций p> p1 > p2 > ... > p7.
- соберите все восемь посл. в одином fasta-файле.
- переименуйте последовательности в этом файле, т.к. разные последовательности в выравнивании не могут иметь совпадающих имен
импортируйте в JalView и выровняйте (Web services > alignment и выберите какую-нибудь программу)
Дублируйте окошко с выравниванием (file > output to textblox (fasta формат) и потом new window )
Найдите места, где выравнивание не соответствует эволюции и поправьте вручную (выделить мышкой прямоугольник, и внутри него двигать Ctrl + мышь или Shift + мышь на свободное место)
- Внести семь точечных мутаций мутаций всех типов позволяет команда msbar пакета EMBOSS. Используйте параметры:
Если вдруг таких мест не обнаружится, то придется повторить эксперимент. Можно указать чуть больше мутаций или взять чуть больше поколений.
Для реализации всех действий создайте bash-скрипт, выполняющий все шаги сразу.
Полезная информация для bash-скрипта
- Как указать программе из EMBOSS одну последовательность (скажем, p1) из fast-файла all.fasta со многими посл-ми: all.fasta:p1
Как изменить имя последовательности p1 на p2: sed 's/>p1/>p2/g'/
sed (stream editor) берет данные из stdout предыдущей команды, заменяет (s от substitute) все встречи >p1 на >p2 (g от global, т.е. заменять всюду) и выдает результат на stdout
- cat p1.fasta p2.fasta p3.fasta выдаёт содержимое указанных файлов последовательно на stdout; если перенаправить в файл, то получится объединение файлов.