Проект в формате JVP с выравниваниями и разметкой можно скачать здесь

Для выполнения заданий использовалось следующее выравнивание Общий вид проекта в JalView можно увидеть на рисунке 1. Рис. 1. Множественное выравнивание последовательностей.

Вручную было построено выравнивание двух последовательностей из множественного выравнивания относительно друг друга, оно представлено на рис.2

Рис. 2. Выравнивание двух последовательностей вручную.

Далее, при помощи команды needle на kodomo, было получено глобальное выравнивание двух последовательностей. Скачать его в формате по умлочанию можно здесь , а в формате fasta здесь . Изображение данного выравнивания представлено на рис. 3.

Рис. 3. Выравнивание двух последовательностей с помощью needle.

Так же было получено наилучшее локальное выравнивание двух последних последовательностей в формате fasta, при помощи команды water на kodomo. Результат в формате fastа можно скачать здесь. Изображение данного выравнивания представлено на рис. 4.

Рис. 4. Выравнивание двух последовательностей с помощью water.

Были получены глобальные и наилучшие локальные выравнивания двух зааведемо негомологичных белков. Для этого использовались последовательности с идентификаторами YP_560184.1 и NP_003707477.1.
Выравнивание с помощью needle в оригинальном формате можено скачать здесь
Выравнивание с помощью water в оригинальном формате можено скачать здесь.
Выравнивание с помощью needle в fasta формате можено скачать здесь.
Выравнивание с помощью water в fasta формате можено скачать здесь.
Изображение данных выравниваний представлено на рис. 5.

Рис. 5. Выравнивание двух заведомо негомологичных последовательностей с помощью needle (сверху) и water (снизу).

Сравнение параметров выравниваний приведено в таблице 1. Выравнивание вручную даёт менее точные результаты, чем глобальное и локальное выравнивание с помощью алгоритмов. Сравнивать локальное и глобальное выравнивание нельзя, т. к. они строятся с разными целями но в случае гомологичных последовательностей длина глобального и локального выравниваний отличаются не намного, в то время как для заведомо негомологичных последовательностей длина локального выравнивания совсем маленькая. В выравниваниях заведомо негомологичных последовательностей наблюдается заметно больше гэпов, с помощью них программа пыталась найти хоть какое-нибудь сходство. Число и процент совпадений в глобальных выравниваниях гомологичных и негомологичных последовательностей различаются не сильно за счёт того, что программа вставила много гэпов в выравнивание негомологичных последовательностей. В локальном выравнивании негомологичных последовательностей мы видим самое большой процент совпавших остатков, однако из этого нельзя сделать вывод о гомологии, т.к. это сходство достигается за счёт большого процента гэпов и оно наблюдается на коротком участке по сравнению с глобальным выравниванием.

Таблица 1.

Длина выравнивания (число колонок) Число совпадений Процент совпадений Число сходных остатков Процент сходных остатков Число гэпов Процент гэпов Число открытий гэпов
Выравнивание вручную в Jalview 96 18.0 18.8 36.0 37.5 18.0 18.8 2
Глобальное выравнивание с помощью needle 107 18 16.5 29.0 26.6 48.0 44.0 4
Локальное выравнивание c помощью water 60.0 17.0 28.3 25.0 41.7 2.0 3.3 1
Глобальное выравнивание двух заведомо негомологичных белков 435 57 13.1 105.0 24.1 217.0 49.9 14
Локальное выравнивание двух заведомо негомологичных белков 145.0 31.0 21.4 57.0 39.3 36.0 24.8 5

Вручную были выравнены два выравнивания - полученное вручную и построенное, при помощи программы needle. Результат в формате fastа можно скачать здесь . Изображение фрагмента данного выравнивания представлено на рис. 6. На нем можно увидеть, что начало выравнено одинаково, но далее needle находит больше совпадений засчет большего числа гэпов.

Рис. 6. Выравнивание двух парных выравниваний.

Проверка правильности выравниваний была проведена с помощью программы SupCheck."S" отмечены участки, подтвержденные совмещением пространственных структур. Она помогла найти ошибки в выравнивании и установить гомологию между участками белка. Фрагмент выравнивания с разметкой представлен на рис. 7. ошибка 2го рода: C_alpha атомы двух остатков, очевидно, хорошо совмещаются, но соответствующие буквы либо не находятся в одной колонке, либо в одной колонке, но колонка не отмечена "+".

Рис. 7. Разметка фрагмента выравнивая, сделанного вручную.