Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2025

Пояснения

1. Программа

Идею алгоритма сравнения выравниваний можно взять из материалов лекции.

Использование программы должно быть удобно для пользователей. Следует подумать о том,

  1. все ли требования к входным файла оговорены в инструкции;
  2. удобно ли запускать и перезапускать программу с теми же или отличными входными файлами;
  3. удобно ли использовать выходную таблицу для анализа.

2. Сравните выравнивания одних и тех же последовательностей разными программами

Для построения выравниваний можно использовать разные сервисы, доступные из Jalview в меню Web service → Alignment, или же программы (muscle, mafft, prank, edialign, emma), установленные на kodomo. У программы mafft много параметров, можно попробовать сравнить их.

В этом случае получаете таблицу номеров одинаково выровненных колонок. Из этой таблицы легко находятся блоки подряд идущих одинаково выровненных колонок, их положение в выравнивании; также участки, в которых нет одинаково выровненных колонок.

Интерес — в сравнении нескольких пар разных программ по параметрам, которые сумеете извлечь из статистических данных, и в выводе вывод о программах: чем их выравнивания отличаются. Подтверждением выводов могут быть визуально проверенные примеры. В описании полезно показать их на рисунках.

Не забудьте дать на странице ссылки на сравниваниемые выравнивания и на один проект Jalview, который включает окна со всеми сравниваемыми выравниваниями.

3. Постройте выравнивание по совмещению структур и сравните его с выравниванием MSA

Выберите семейство Pfam, в котором есть 3D структуры минимум трех разных белков семейства. Необходимо выбрать 3D структуры разных белков, а не разных расшифровок пространственной структуры одного и того же белка.

Нужно сравнить два выравнивания последовательностей белков:

В веб-интерфейсе программы PDBeFold выберите вариант множественного (multiple) совмещения структур. Последовательно добавьте PDB-коды структур с указанием цепи. После завершения работы программы можно будет скачать выравнивание в формате fasta. Кроме того, программа выдаёт результаты в формате PDB, которые можно загрузить в PyMOL для визуализации совмещённых структур.

Если PDBeFold не работает: В PDB доступно совмещение только пар структур (Заходим на сайт PDB → Навигация наверху страницы → Analyze → Pairwise Structure Alignment). Можно задать три (A, B, C) или более pdb кодов на вход. Тогда первый белок A считается референсом и строится совмещение A с B и A c С. Выдаётся два выравнивания: B с референсом A и C с референсом A. Выравнивания экспортируются в виде текстовых файлов в формате fasta. Из выравниваний A с B и A с C можно построить выравнивание A, B и C в текстовом редакторе следующим образом: Открыть файл с двумя выравниваниями в текстовом редакторе. У Вас есть общая последовательность А в двух выравниваниях. Идете глазами от первой позиции выравнивания и сравниваете последовательность А в первом и втором выравнивании. Если в первом выравнивании в А появляется гэп, то вставляете гэп по второе выравнивание (в обе последовательности второго выравнивания!). И наоборот. Потом лишнюю последовательность А удаляете, получается множественное выравнивание из 3 последовательностей

Не забудьте, что сравнивать надо выравнивания одних и тех же последовательностей! Последовательность белка в записи UniProt может отличаться от последовательности белка в кристалле из записи PDB. Поэтому для MSA используйте только последовательности, скачанные непосредственно с сайта PDB в формате FASTA, либо воспользуйтесь функцией File → Fetch Sequences в JalView. При загрузке последовательностей в JalView нужно указать базу данных PDB и коды доступа ваших структур. Самый быстрый вариант — перевыровнять последовательности из выравнивания PDBeFold.

Сравнить эти два выравнивания можно так, как и в предыдущем задании, т.е. глазами или программой.

При загрузке последовательностей в JalView с помощью Fetch Sequences аннотации вторичной структуры белков подгружаются автоматически. Отобразить их под множественным выравниванием можно, нажав на название последовательности правой кнопкой мыши → название последовательности → Add reference annotation.

Если вы скачали последовательности с сайта PDB, то можно добавить структурную аннотацию вручную (нажать на название последовательности правой кнопкой мыши → 3D structure data → загрузить по ID или из файла *.pdb, который вы получили при совмещении структур)

Также перед сравнением выравниваний не забудьте привести названия последовательностей к одинаковому виду.

В отчете должны быть ссылки на выравнивания в fasta формате, проект в Jalview c двумя выравниваниями и изображение совмещения трех структур.

Визуализация совмещения на сайте не всегда срабатывает, поэтому лучше скачать все три структуры (вверху страницы с ответами, кнопки Download — там координаты атомов приведены в системах координат, совмещающих структуры) и открыть все три в PyMol.

4. Кратко опишите одну из программ MSA

Это задание на работу с литературой. Поиск в Google по имени программы, поиск статей в Pubmed или Google Scholar. Обязательно указывайте источник информации.

2025/2/pr12/hints (последним исправлял пользователь vakulenko_julia 2026-05-01 19:09:03)