Предсказание парных выравниваний
Текстовое описание:
В работе изучается построение парных выравниваний с помощью jalView, needle и water.
Проект в JalView
1. С помощью утилиты jalView Principal component analysis из исходного множественного выравнивания восьмого практикума отобрано две наименее схожих последовательности: ALIAD длиной 234 АК и BUTPB длиной 238 АК.
align_13.fasta.
2.
Отобранные последовательности выровнены отдельно в jalView:
3.
4.
С помощью needle (глобальное выравнивание) и water (локальное выравнивание) были построены следующие выравнивания:
-
needle.fasta со значениями по умолчанию (штраф за открытие гэпа - 10.0, штраф за расширение гэпа - 0.5)
-
needle_1.fasta - выравнивание needle со штрафом за открытие гэпа 7.0 привело к появлению новых гэпов в выравнивании:
-
water.fasta - выравнивание в water
-
water_1.fasta - выравнивание в water со штрафом за открытие гэпа 7.0 (понижение штрафа за расширение гэпов в силу специфики последовательностей не привело к каким-либо изменениям в выравнивании)
Выравнивания в needle и water в случае исследуемой пары идентичны при одинаковых параметрах:
5.
Для парного выравнивания с белком Hippea Maritima длиной в 419 АК выбран белок cca (из организма Sorangium cellulosum So ce56, идентификатор в UniProt A9F087) длиной в 461 АК. Парные выравнивания:
Общий вид выравниваний:
7.
Дл сравнения парных выравниваний были взяты парное выравнивание двух последовательностей из множественного выравнивания в 8-ой работе и парное выравнивание тех же последовательностей в needle со значениями по умолчанию. После выравнивания вручную длина стала 238 позиций, и сравнение приобрело следующий вид:
В итоге разница между парными выравниваниями составила 9 позиций, блоками по 4 и 5, что продемонстрировано на рисунке:
8.
-
Для сравнения гомологичного и негомологичного выравнивания можно взять результаты пунктов 4 и 5.
infoalign для гомологичного выравнивания выдаёт 4 гэпа, 130 идентичных, 32 схожих и 76 отличающихся позиций при общей длине выравнивания 238 позиций
Для парного выравнивания негомологичных последовательностей:
длина гэпа (суммарная по последовательности, максимальная) 153, 84 идентичных, 70 схожих и 306 отличающихся позиций при общей длине выравнивания 571 позиция.
Вывод: процент идентичных от общей длины выравнивания в случае гомологов составил 54,6%, а для негомологов - 14,7%. Это означает, что можно найти идентичные участки даже у негомологичных последовательностей, но их процент будет примерно в 4 раза меньше, чем у гомологичных.
-
На примере моей последовательности, построенной в needle и в water, отличий между результатами программ при идентичности параметров запуска не наблюдалось.
-
Сравнение локального и глобального выравниваний проводилось на примере двух негомологичных последовательностей в needle и в water. Для глобального выравнивания needle сводка указана выше, для water данные следующие:
длина гэпа - 27, 42 идентичных, 7 схожих, 103 отличающихся позиции при длине выравнивания - 152 АК. Процент идентичных позиций у локального выравнивания 27,6% против 14,7% у глобального, последнее по "качеству" однозначно проигрывает.
-
В случае сравнения парного выравнивания со множественным первое всегда будет не хуже второго, поскольку при выравнивании могут появиться дополнительные гэпы, что ведёт к увеличению длины выравнивания и к снижению процента идентичных и схожих позиций
|