Сравнение выравниваний

1. Сравнение выравниваний одних и тех же последовательностей разными программами
Для выравнивания я взяла мнемонику KITH (из практикума 9) и GAS2. Для сравнения вывода я взяла программы MUSCLE и Clustal.
kith_human, kith_mouse, kith_hhv1, kith_dictd, kith_staan, kith_ecoli, kith_bacsu
Здесь можно скачать выравнивание (выравнивание Muscle снизу).
Выравнивания программ очень похожи. Вероятно, это связано с тем, что мало гэпов, из-за которых обычно происходит смещение. Например, участок с 91 по 97 (для обеих последовательностей) отличается большим количеством гэпов, поэтому программы по-разному расположили глицин относительно большого инделя. Или участок с 224 по 232: программа MUSCLE нашла целый блок на этом участке, где много похожих аминокислот у наших белков, в то врем как Clustal не показывает никакой гомологичности конечных участков более коротких белков в наших выравниваниях.
Таблица 1. Одинаковые участки при ручном оценивании выравниваний белков с мнемоникой kith
MUSCLEClustalДлина участка
18-6418-6447
67-9067-9024
103-175 103-17573
Я думаю, что мы добились большого сходства между белками только за счет того, что было мало гэпов, потому что в начале и конце выравниваний, где сильно разнятся последовательности, результаты работы программ были разными.
GAS2_HUMAN, GAS2_MOUSE, GAS2_YEAST, GAS2_SCHPO, GAS2_HELAN, GAS2_MAGO7, GAS2_MAGOR
Здесь можно скачать выравнивание (выравнивание Muscle снизу).
Для этих белков программы сработали совершенно по-разному, если в качестве референсной брать выдачу Clustal, то сервис VerAlign показывет, что нет ни одной полностью сходящейся колонки, даже если верхние 4 последовательности совпадают, то нижние "уезжают" из-за гэпов. Если же в качестве референсной использовать выдачу MUSCLE, то ситуация становится намного хуже. Таким образом, я не могу найти одинковых кусков в данных выравниваниях.
Много букв
Рис 1. Вырезка из результата работы VerAlign. Референсное выравнивание - выдача Clustal
Сравнение выравниваний с помощью программы Елизаветы Плешко:
Результат сравнения выравниваний для мнемоники kith записан в файл.
Доля одинаково выравненных позиций в первом выравнивании: 75%
Доля одинаково выравненных позиций во втором выравнивании: 75%
Результат сравнения выравниваний для мнемоники GAS2 записан в файл.
Доля одинаково выравненных позиций в первом выравнивании: 1%
Доля одинаково выравненных позиций во втором выравнивании: 1%
2. Построение выравнивания по совмещению структур
Для выравнивания белков в PyMol я взяла 5els, 2ctm, 4lij из семейства KH_1 (PF00013). К сожалению, PyMol при парном выравнивании не выдает последовательности, поэтому я не смогла их ни с чем сравнить. Однако точно могу сказать, что пространственные структуры довольно хорошо сопоставились.
Много букв
Рис 2. Пространственное отображение выравнивания; изображено по одной цепи от каждого белка
Много букв
Рис 3. Пространственное отображение выравнивания с полным изображением белков
Я решила также сделать выравнивание трех последовательностей с помощью Clustal и webPRANK, но результаты оказались очень странными... Здесь можно скачать выравнивание (Clustal слева и webPRANK справа). Вероятно, это свезано с тем, что один белок состоит из одной цепи, а остальные из трех и шести. Хотя все равно результат странный.
3. Описание программы T-Coffee
T-Coffee - это программа множественного выравнивания, которая позволяет комбинировать уже полученные в других программах выравнивания с получением нового, максимально хорошо согласующегося со всеми методами. Для начала он попарно сравнивает последовательности, и только после этого получает полное выравнивание, а также серии локальных выравниваний. Впоследствии из всех этих выравниваний получается множественное выравнивание.
Однако эта программа может как и все остальные выравнивать обычные последовательности:
1. Изучает библиотеку на наличие участков, которые могут быть выровнены
2. Считает вес каждого из них
3. Комбинирует их так, чтобы получилось множественное выравнивание, в котором окажутся участки, имеющие больший суммарный вес
Эта программа также позволяет самостоятельно выровнять определенные важные участки и задать им больший вес. Для вашего удобства T-Coffee может сгенерировать (по умолчанию) свой собственный список, выполнив все возможные глобальные попарные выравнивания и 10 наилучших локальных выравниваний, связанных с каждой парой последовательностей. Каждая пара остатков, наблюдаемых выровненными в этих попарных выравниваниях, становится строкой в библиотеке.
Источник 1
Источник 2