Предсказание парных выравниваний
Для построения выравнивания были использованы две наименее схожих последовательности из тех, что обсуждались в предыдущем
практикуме. Это последовательности DESOD и ROSHA. Последовательности были выбраны при помощи метода Principal component analysis.
Последовательности в формате fasta можно посмотреть по ссылкам: ROSHA, DESOD.
Проект JalView можно скачать по ссылке.
Полученное выравнивание с раскраской ClustalX представлено на Рис. 1.
Рис. 1. Выравнивание с раскраской ClustalX
При помощи программ needle и water, которые используют алгоритмы Нидлмана - Вунша и Смита - Ватермана соответственно,
были построены парные выравнивания этих последовательностей (needle строит глобальное парное выравнивание, water - локальное).
На Рис. 2 и Рис. 3 представлены изобрадения парных выравниваний, построенные данными программами со стандартными параметрами
(матрица BLOSUM62, gap open = 10.0, gap extension = 0.5).
Полученные выравнивания в формате fasta можно скачать по ссылкам: needle, water.
Рис. 2. Парное глобальное выравнивание последовательностей DESOD и ROSHA, полученное с помощью программы needle с параметрами gap open = 10.0, gap extension = 0.5, раскраска ClustalX.
Рис. 3. Парное локальное выравнивание последовательностей DESOD и ROSHA, полученное с помощью программы water с параметрами gap open = 10.0, gap extension = 0.5, раскраска ClustalX.
При помощи программ needle и water были также построены выравнивания с измененными параметрами.
Для глобального выравнивания был уменьшен штраф за открытие гэпа (gap open = 3.0), а для локального - увеличен штраф за продление гэпа (gap extension = 2.0).
Результат для программ needle и water представлен на Рис. 4 и Рис. 5 соответственно.
Полученные выравнивания в формате fasta можно скачать по ссылкам: needle_1, water_1.
Рис. 4. Парное локальное выравнивание последовательностей DESOD и ROSHA, полученное с помощью программы needle с параметрами gap open = 3.0, gap extension = 0.5, раскраска ClustalX.
Рис. 5. Парное локальное выравнивание последовательностей DESOD и ROSHA, полученное с помощью программы water с параметрами gap open = 10.0, gap extension = 2.0, раскраска ClustalX.
Далее были построены парные выравнивания двух последовательностей заведомо негомологичных белков YP_007078865 и YP_003816619 (Рис. 6 и 7).
Последовательности в формате fasta можно скачать по ссылкам: YP_003816619, YP_007078865.
Выравнивания построены с помощью программ needle и water со стандартными параметрами, fasta-файлы можно скачать по ссылкам:
needle, water.
Рис. 6. Парное локальное выравнивание последовательностей белков YP_007078865 и YP_003816619, полученное с помощью программы needle с параметрами gap open = 3.0, gap extension = 0.5, раскраска ClustalX.
Рис. 7. Парное локальное выравнивание последовательностей белков YP_007078865 и YP_003816619, полученное с помощью программы water с параметрами gap open = 10.0, gap extension = 2.0, раскраска ClustalX.
Было проведено сравнение построенных программой needle (с измененными параметрами: gap open = 3.0, gap extension = 0.5) выравниваний последовательностей DESOD и ROSHA с исходным, полученным из множественного выравенивания. Для этого оба выравнивания были объединены в одно окно JalView и выравнены вручную друг относительно друга. Колонки, имеющиеся в обоих выравниваниях, считаются совпадающими, а те, которые присутствуют только в одном выравнивании - различными. Изображение полученного выравнивания представлено на Рис. 8.
Рис. 8. Сравнение парных выравнивание последовательностей DESOD и ROSHA: сверху полученное
из множественного выравнивания,
снизу - с помощью программы needle с параметрами gap open = 3.0, gap extension = 0.5, раскраска ClustalX.
Примеры различающихся участков: позиции 18-21 и 78-95. Такие различия обусловлены наличием длинного гэпа в последовательности DESOD в выравнивании, построенном программой needle, а также тем, что при выравнивании вручную пришлось вставить гэпы в обе последовательности исходного выравнивания. Несмотря на это, можно заметить, что различающихся позиций немного - всего 23.