Пояснения
1. Программа
Идею алгоритма сравнения выравниваний можно взять из материалов лекции.
Использование программы должно быть удобно для пользователей. Следует подумать о том,
- все ли требования к входным файла оговорены в инструкции;
- удобно ли запускать и перезапускать программу с теми же или отличными входными файлами;
- удобно ли использовать выходную таблицу для анализа.
2. Сравните выравнивания одних и тех же последовательностей разными программами
Для построения выравниваний можно использовать разные сервисы, доступные из Jalview в меню Web service → Alignment, или же программы (muscle, mafft, prank, edialign, emma), установленные на kodomo. У программы mafft много параметров, можно попробовать сравнить их.
Ручным методом в Jalview. Минимально, следует найти три участка совпадения выравниваний и два участка несовпадения.
- С помощью программы для сравнения выравниваний. Этот вариант предпочтителен.
В этом случае получаете таблицу номеров одинаково выровненных колонок. Из этой таблицы легко находятся блоки подряд идущих одинаково выровненных колонок, их положение в выравнивании; также участки, в которых нет одинаково выровненных колонок.
Интерес — в сравнении нескольких пар разных программ по параметрам, которые сумеете извлечь из статистических данных, и в выводе вывод о программах: чем их выравнивания отличаются. Подтверждением выводов могут быть визуально проверенные примеры. В описании полезно показать их на рисунках.
Не забудьте дать на странице ссылки на сравниваниемые выравнивания и на один проект Jalview, который включает окна со всеми сравниваемыми выравниваниями.
3. Постройте выравнивание по совмещению структур и сравните его с выравниванием MSA
Выберите семейство Pfam, в котором есть 3D структуры минимум трех разных белков семейства. Необходимо выбрать 3D структуры разных белков, а не разных расшифровок пространственной структуры одного и того же белка.
Нужно сравнить два выравнивания последовательностей белков:
- Выравнивание последовательностей, полученное из совмещения структур. В таком выравнивании в колонке находятся аминокислоты, СА атомы которых расположены рядом в совмещении.
В веб-интерфейсе программы PDBeFold выберите вариант множественного (multiple) совмещения структур. Последовательно добавьте PDB-коды структур с указанием цепи. После завершения работы программы можно будет скачать выравнивание в формате fasta. Кроме того, программа выдаёт результаты в формате PDB, которые можно загрузить в PyMOL для визуализации совмещённых структур.
Если PDBeFold не работает: В PDB доступно совмещение только пар структур (Заходим на сайт PDB → Навигация наверху страницы → Analyze → Pairwise Structure Alignment). Можно задать три (A, B, C) или более pdb кодов на вход. Тогда первый белок A считается референсом и строится совмещение A с B и A c С. Выдаётся два выравнивания: B с референсом A и C с референсом A. Выравнивания экспортируются в виде текстовых файлов в формате fasta. Из выравниваний A с B и A с C можно построить выравнивание A, B и C в текстовом редакторе следующим образом: Открыть файл с двумя выравниваниями в текстовом редакторе. У Вас есть общая последовательность А в двух выравниваниях. Идете глазами от первой позиции выравнивания и сравниваете последовательность А в первом и втором выравнивании. Если в первом выравнивании в А появляется гэп, то вставляете гэп по второе выравнивание (в обе последовательности второго выравнивания!). И наоборот. Потом лишнюю последовательность А удаляете, получается множественное выравнивание из 3 последовательностей
- Выравнивание последовательностей, полученное программой MSA. Тут всё просто — делайте его любой программой MSA.
Не забудьте, что сравнивать надо выравнивания одних и тех же последовательностей! Последовательность белка в записи UniProt может отличаться от последовательности белка в кристалле из записи PDB. Поэтому для MSA используйте только последовательности, скачанные непосредственно с сайта PDB в формате FASTA, либо воспользуйтесь функцией File → Fetch Sequences в JalView. При загрузке последовательностей в JalView нужно указать базу данных PDB и коды доступа ваших структур. Самый быстрый вариант — перевыровнять последовательности из выравнивания PDBeFold.
Сравнить эти два выравнивания можно так, как и в предыдущем задании, т.е. глазами или программой.
При загрузке последовательностей в JalView с помощью Fetch Sequences аннотации вторичной структуры белков подгружаются автоматически. Отобразить их под множественным выравниванием можно, нажав на название последовательности правой кнопкой мыши → название последовательности → Add reference annotation.
Если вы скачали последовательности с сайта PDB, то можно добавить структурную аннотацию вручную (нажать на название последовательности правой кнопкой мыши → 3D structure data → загрузить по ID или из файла *.pdb, который вы получили при совмещении структур)
Также перед сравнением выравниваний не забудьте привести названия последовательностей к одинаковому виду.
В отчете должны быть ссылки на выравнивания в fasta формате, проект в Jalview c двумя выравниваниями и изображение совмещения трех структур.
Визуализация совмещения на сайте не всегда срабатывает, поэтому лучше скачать все три структуры (вверху страницы с ответами, кнопки Download — там координаты атомов приведены в системах координат, совмещающих структуры) и открыть все три в PyMol.
4. Кратко опишите одну из программ MSA
Это задание на работу с литературой. Поиск в Google по имени программы, поиск статей в Pubmed или Google Scholar. Обязательно указывайте источник информации.

2024
2023
2022
2021
2020
2019
2018
2017