Учебная страница курса биоинформатики,
год поступления 2023
Пояснения
1. Программа
Использование программы должно быть удобно для пользователей. Следует подумать о том
- все ли требования к входным файла оговорены в инструкции
- удобно ли запускать и перезапускать программу с теми же или отличными входными файлами
- удобно ли использовать выходную таблицу для анализа
2. Сравните выравнивания одних и тех же последовательностей разными программами
ручным методом в Jalview (можно использовать сервис [ VerAlign ]. Минимально, следует найти несколько участков совпадения выравниваний и участков несовпадения.
В этом варианте ожидаю сравнения двух пар выравниваний и заключение по ним.
- с помощью программы для сравнения выравниваний. Этот вариант предпочтителен.
В этом случае получаете таблицу номеров одинаково выровненных колонок. Из этой таблицы легко находятся блоки подряд идущих одинаково выровненных колонок, их положение в выравнивании; также участки, в которых нет одинаково выровненных колонок.
Интерес - в сравнении нескольких пар разных программ по параметрам которые сумеете извлечь из статистических данных. И сделаете вывод о программах - чем их выравнивания отличаются. Подтверждением выводов могут быть визуально проверенные примеры. В описании полезно показать их на рисунках.
Следует сделать ссылку на Jalview проекты со сравниваемыми выравниваниями - чтобы легко было проверять.
3. Постройте выравнивание по совмещению структур и сравните его с выравниванием MSA
Выбираете семейство Pfam, в котором есть 3D структуры разных белков семейства.
Именно разных белков, а не разных расшифровок одного и того же белка.
Минимум трёх.
Постройте совмещение в пространстве полипептидных цепей сравниваемых структур. При этом C_alpha атомы расположенные рядом считаются выровненными. Таким образом строится выравнивание последовательностей.
В PDB доступно совмещение только пар структур (Заходим на сайт PDB -> Навигация наверху страницы -> Analyze -> Pairwise Structure Alignment). Можно задать три (A, B, C) или более pdb кодов на вход. Тогда первый белок A считается референсом и строится совмещение A с B и A c С. Выдаётся два выравнивания: B с референсом A и C с референсом A. Из выравниваний A с B и A с C можно построить выравнивание A, B и C в текстовом редакторе.
У меня есть текстовый файл с двумя выравниваниями, который я экспортировал(а) из pdb. Как из этого файла получить множественное выравнивание? Открыть файл с двумя выравниваниями в текстовом редакторе и делать следующее. У Вас есть общая последовательность А в двух выравниваниях. Идете глазами от первой позиции выравнивания и сравниваете последовательность А в первом и втором выравнивании. Если в первом выравнивании в А появляется гэп, то вставляете гэп по второе выравнивание. И наоборот. Потом лишнюю последовательность А удаляете, получается множественное выравнивание из 3 последовательностей
Можно воспользоваться программой Expresso, которая использует информацию о структуре, чтобы сделать множественное выравнивание последовательностей. Вы не получите на выходе совмещение структур, но зато будет готовое множественное выравнивание последовательностей, которое исходило из совмещения соответствующих структур. Спасибо Салиме Каримовой за идею.
Также можно построить выравнивание A, B и C одной из программ MSA. Задача - сравнить их и написать выводы.
Получить парные совмещения структур можно в pymol с помощью команды align, но эта команда сначала выполняет выравнивание последовательностей, а уже потом делает наложение структур. В этом задании мы советуем использовать программы выравнивания структур, которые не опираются на выравнивания последовательностей.
Коллеги, с этим заданием возникло больше всего проблем.
Нужно сравнить два выравнивания последовательностей белков.
- Выравнивание последовательностей, полученное из совмещения структур. В таком выравнивании в колонке находятся аминокислоты, СА атомы которых расположены рядом в совмещении. Как получить из совмещения структур текстовый файл с соответствующим выравниванием последовательностей? См. выше.
Выравнивание последовательностей, полученное программой MSA. Тут всё просто - делайте его любой программой MSA, например, реализованной JalView.
Таким образом, в отчете должна быть ссылка на два выравнивания в формате fasta или любом другом формате, используемом для представления множественного выравнивания. Удобно дать в виде проекта JalView с двумя выравниваниями. Одно выравнивание из совмещения структур, а второе - сделанное MSA. И в отчете надо сравнить эти два выравнивания так, как Вы делали в предыдущем задании, - глазами или программой.
Картинка с совмещенными структурами - это не текстовый файл с выравниванием!
4. Кратко опишите одну из программ MSA
Это задание на работу с литературой. Поиск в google по имени программы - с этим, верю, справитесь)))
Поиск статей в Pubmed - посложнее. Учитесь! Можете спрашивать меня, помогу если смогу.
Для того чтобы получить соответствующие выравнивания в команде align используем аргумент "object", затем File -> Export Alignment.