Пояснения
1. Программа
Идею алгоритма сравнения выравниваний можно взять из материалов лекции.
Использование программы должно быть удобно для пользователей. Следует подумать о том
- все ли требования к входным файла оговорены в инструкции
- удобно ли запускать и перезапускать программу с теми же или отличными входными файлами
- удобно ли использовать выходную таблицу для анализа
2. Сравните выравнивания одних и тех же последовательностей разными программами
ручным методом в Jalview (можно использовать сервис VerAlign). Минимально, следует найти несколько участков совпадения выравниваний и участков несовпадения.
В этом варианте ожидаю сравнения двух пар выравниваний и заключение по ним.
- с помощью программы для сравнения выравниваний. Этот вариант предпочтителен.
В этом случае получаете таблицу номеров одинаково выровненных колонок. Из этой таблицы легко находятся блоки подряд идущих одинаково выровненных колонок, их положение в выравнивании; также участки, в которых нет одинаково выровненных колонок.
Интерес - в сравнении нескольких пар разных программ по параметрам которые сумеете извлечь из статистических данных. И сделаете вывод о программах - чем их выравнивания отличаются. Подтверждением выводов могут быть визуально проверенные примеры. В описании полезно показать их на рисунках.
Следует сделать ссылку на Jalview проекты со сравниваемыми выравниваниями - чтобы легко было проверять.
3. Постройте выравнивание по совмещению структур и сравните его с выравниванием MSA
Выбираете семейство Pfam, в котором есть 3D структуры минимум трех разных белков семейства. Необходимо выбрать 3D структуры разных белков, а не разных расшифровок пространственной структуры одного и того же белка.
Нужно сравнить два выравнивания последовательностей белков:
- Выравнивание последовательностей, полученное из совмещения структур. В таком выравнивании в колонке находятся аминокислоты, СА атомы которых расположены рядом в совмещении.
В PDB доступно совмещение только пар структур (Заходим на сайт PDB → Навигация наверху страницы → Analyze → Pairwise Structure Alignment). Можно задать три (A, B, C) или более pdb кодов на вход. Тогда первый белок A считается референсом и строится совмещение A с B и A c С. Выдаётся два выравнивания: B с референсом A и C с референсом A. Выравнивания экспортируются в виде текстовых файлов. Из выравниваний A с B и A с C можно построить выравнивание A, B и C в текстовом редакторе следующим образом:
Открыть файл с двумя выравниваниями в текстовом редакторе. У Вас есть общая последовательность А в двух выравниваниях. Идете глазами от первой позиции выравнивания и сравниваете последовательность А в первом и втором выравнивании. Если в первом выравнивании в А появляется гэп, то вставляете гэп по второе выравнивание (в обе последовательности второго выравнивания!). И наоборот. Потом лишнюю последовательность А удаляете, получается множественное выравнивание из 3 последовательностей
Выравнивание последовательностей, полученное программой MSA. Тут всё просто - делайте его любой программой MSA, например, доступной из JalView.
Сравнить эти два выравнивания можно так, как Вы делали в предыдущем задании, т.е. глазами или программой.
В отчете должна быть ссылка на проект в Jalview c двумя выравниваниями и изображение совмещения трех структур.
4. Кратко опишите одну из программ MSA
Это задание на работу с литературой. Поиск в Google по имени программы, поиск статей в Pubmed. Обязательно указывайте источник информации.