Предсказание парных выравниваний

Текстовое описание:

В работе изучается построение парных выравниваний с помощью jalView, needle и water.

Проект в JalView

1.

С помощью утилиты jalView Principal component analysis из исходного множественного выравнивания восьмого практикума отобрано две наименее схожих последовательности: ALIAD длиной 234 АК и BUTPB длиной 238 АК.

align_13.fasta.

2.

Отобранные последовательности выровнены отдельно в jalView:

3.

4.

С помощью needle (глобальное выравнивание) и water (локальное выравнивание) были построены следующие выравнивания:
  • needle.fasta со значениями по умолчанию (штраф за открытие гэпа - 10.0, штраф за расширение гэпа - 0.5)
  • needle_1.fasta - выравнивание needle со штрафом за открытие гэпа 7.0 привело к появлению новых гэпов в выравнивании:
  • water.fasta - выравнивание в water
  • water_1.fasta - выравнивание в water со штрафом за открытие гэпа 7.0 (понижение штрафа за расширение гэпов в силу специфики последовательностей не привело к каким-либо изменениям в выравнивании)

Выравнивания в needle и water в случае исследуемой пары идентичны при одинаковых параметрах:

5.

Для парного выравнивания с белком Hippea Maritima длиной в 419 АК выбран белок cca (из организма Sorangium cellulosum So ce56, идентификатор в UniProt A9F087) длиной в 461 АК. Парные выравнивания:
Общий вид выравниваний:

7.

Дл сравнения парных выравниваний были взяты парное выравнивание двух последовательностей из множественного выравнивания в 8-ой работе и парное выравнивание тех же последовательностей в needle со значениями по умолчанию. После выравнивания вручную длина стала 238 позиций, и сравнение приобрело следующий вид:

В итоге разница между парными выравниваниями составила 9 позиций, блоками по 4 и 5, что продемонстрировано на рисунке:

8.

  1. Для сравнения гомологичного и негомологичного выравнивания можно взять результаты пунктов 4 и 5.
    infoalign для гомологичного выравнивания выдаёт 4 гэпа, 130 идентичных, 32 схожих и 76 отличающихся позиций при общей длине выравнивания 238 позиций Для парного выравнивания негомологичных последовательностей:
    длина гэпа (суммарная по последовательности, максимальная) 153, 84 идентичных, 70 схожих и 306 отличающихся позиций при общей длине выравнивания 571 позиция.
    Вывод: процент идентичных от общей длины выравнивания в случае гомологов составил 54,6%, а для негомологов - 14,7%. Это означает, что можно найти идентичные участки даже у негомологичных последовательностей, но их процент будет примерно в 4 раза меньше, чем у гомологичных.
  2. На примере моей последовательности, построенной в needle и в water, отличий между результатами программ при идентичности параметров запуска не наблюдалось.
  3. Сравнение локального и глобального выравниваний проводилось на примере двух негомологичных последовательностей в needle и в water. Для глобального выравнивания needle сводка указана выше, для water данные следующие:
    длина гэпа - 27, 42 идентичных, 7 схожих, 103 отличающихся позиции при длине выравнивания - 152 АК. Процент идентичных позиций у локального выравнивания 27,6% против 14,7% у глобального, последнее по "качеству" однозначно проигрывает.
  4. В случае сравнения парного выравнивания со множественным первое всегда будет не хуже второго, поскольку при выравнивании могут появиться дополнительные гэпы, что ведёт к увеличению длины выравнивания и к снижению процента идентичных и схожих позиций