Предсказание парных выравниваний

При выполнении задания было использовано множественное выравнивание с прошлого занятия. Скачать проект

C помощью метода главных компонент программы JalView в исходном выравнивании было выделено 2 наименее схожих последовательности - BREBN и BUTPB. Выбранные последовательности очищены от пустых колонок и сохранены в проэкте во вкладке pair alignment; исходное множественное выравнивание сохранено во вкладке original alignment. Последовательности очищены от гэпов и сохранены в отдельные fasta-файлы: BREBN в seq1.fasta, BUTPB в seq2.fasta.



Рисунок 1: Расположение последовательностей в трехмерном пространстве согласно их сходству.

При помощи установленного на kodomo пакета EMBOSS было построено 4 парных выравнивания:

  • Глобальное парное выравнивание программой needle со стандартными значениями штрафов за гэпы: needle.fasta.
  • То же самое, но с уменьшенным до 3 штрафом за открытие гэпа: needle_1.fasta.
  • Локальное парное выравнивание программой water со стандартными значениями штрафов: water.fasta.
  • То же самое, но с уменьшенным до 0.1 штрафом за продолжение гэпа: water_1.fasta.

Уменьшение штрафа за открытие гэпа серьезно изменило внешний вид выравнивания: количество гэпов резко увеличилось. Уменьшение штрафа за продолжение гэпа не привнесло значительных изменений.

При помощи установленного на kodomo пакета EMBOSS были построены парные глобальное и локальное выравнивания заведомо негомологичных белков Q8A1A2 и F4BY60: nonhomologous_needle.fasta и nonhomologous_water.fasta.

Все описанные ранее выравнивания сохранены в проекте на отдельных вкладках.

Выполняя задание 7, я сравнивал парное выравнивание, взятое из множественного с построенным программой, а именно - needle c уменьшенным штрафом за открытие гэпа - needle_1.fasta, так как выравнивания, полученные с помощью программ needle и water со стандартными параметрами, мало отличаются от исходного. Различающиеся участки, например, 35-40 и начиная с 50, потому что с этого момента в выравниваниях появляется большое количество гэпов в разных последовательностях, поэтому колонки начинают отличаться. Всего выравнивания различаются по 38 колонкам.

Рисунок 1: сравнение двух выравниваний

Рисунок 2: Совпадающие колонки с каждого из концов от участка различия

Таблица 1: сравнение полученных ранее выравниваний.

Выравнивание Длина Число и длина гэпов Число и процент консервативных колонок Число и процент колонок со сходными остатками
Исходное парное 157 3 (7, 6) 72 (48%) 20 (13%)
needle 152 1 (1, 2) 73 (48.6%) 21 (14%)
needle_1 163 7 (13, 12) 80 (53%) 19 (12.6%)
water 152 1 (1, 2) 73 (48.6%) 21 (14%)
water_1 152 1 (1, 2) 73 (48.6%) 22 (14.6%)
nonhomologous_needle 449/456 6 (31) / 10 (35) 56 (13.4%) 52 (12.4%)
nonhomologous_water 95 2 (9) / 3 (13) 22 (25.6%) 18 (21%)

"Плохие" выравнивания отличаются от всех остальных в первую очередь числом гэпов (оно разительно больше) и их длиной. Процент консервативных колонок в них гораздо меньше, чем в "нормальных" выравниваниях, процент колонок со сходными остатками отличается незначительно.
Можно предположить, что локально выравнивание лучше глобального, так как в этом случае число и длина гэпов меньше. При построении выравнивания needle_1 был уменьшен штраф за открытие гэпа, что сказалось на их числе и длине (больше, чем в needle с параметрами по умолчанию). Выравнивание water_1, с заданным параметром штрафа за продолжение гэпа меньше дефолтного, практически не отличается от water со стандартными параметрами.
Парное выравнивание лучше множественного, так как в нем можно максимально сократить число гэпов и их длину по сравнению с множественным, где сильной помехой является число выравниваемых последовательностей.



Назад к странице семестров

© Andrew Sigorskih,2015.