Выбранное семейство: PF00015. Выравнивания созданы с помощью Jalview (Web Service -> Alignment -> [METHOD] with defaults). В качестве программы сравнения выравниваний используется aligncomp.py (Copyright by Дмитрий Липченчук).
Блоки одинаково выровенных колонок: (1,1)=(11,11), (46,78)=(50,82), (83,111)=(87,115), (117,125)=(121,129), (131,180)=(135,184). Большая часть последовательности оказалась равной. Все одинаково выровненные колонки входят в какой-либо блок.
Блоки одинаково выровненных колонок: (1,1)=(11,11), (46,50)=(78,82), (82,86)=(111,115). В этом случае равные блоки расположены только в первых двух третях выравниваний. Выровненные колонки, не входящие в блоки: 80=84, 181=213, однако в обеих колонках гэпы у всех последовательностей, кроме одной.
У mafft и muscle больше совпадающих блоков, чем у mafft и tcoffee. С помощью опции программы -p можно узнать процент колонок первого выравнивания, идентичных колонкам второго, по отношению к длине первого выравнивания и наоборот. В первом случае идентичными оказались 69.84% колонок у mafft и 68.75% у muscle, во втором – 40.21% у mafft и 34.55% у tcoffee. Можно сделать вывод, что в моем случае выравнивания, полученные с помозью mafft и muscle, больше походят друг на друга, чем выравнивания, полученные алгоритмами mafft и tcoffee. Также заметно, что и в первом, и во втором случае координаты некоторых блоков либо совпадают (например: (1,1)=(11,11)), либо имеют области пересечения (например, (46,50)=(50,54) у mafft-muscle и (46,50)=(78,82) у mafft-tcoffee).
Выбранное семейство: PF00241, содержит 69 структур. Выбранные белки: 1ahq, 1ak6, 1ak7. На сайте RCSB PDB проведены парные выравнивания 1-й со 2-й и 1-й с 3-й последовательностью (исходный файл). После того, как я за счет добавления гэпов получил множественное выравнивание для всех трех последовательностей, я провел перевыравнивание программой mafft.
Блоки одинаково выровненных колонок: (1,1)=(28,28), (46,42)=(62,58). Отдельно расположенных одинаково выровненных
колонок нет. При структурном выравнивании гэпов больше, чем при использовании mafft, но идентичных позиций значительно меньше:
В первом случае их всего 12 и нет двух подряд идущих, во втором –
несколько блоков по 3-5 консервативных позиций (например: 88-92, 121-124), на основании
чего можно сделать вывод, что в данном случае выравнивание mafft показало себя лучше.
Проект Jalview
Clustal Omega – программа для множественного выравнивания последовательностей, разработанная как усовершенствование предыдущих версий Clustal. Использует алгоритм mBed, осуществляющий кластеризацию со сложностью алгоритма O(N*logN). Способен задействовать сразу несколько ядер процессора для параллельных вычислений.
Использует HMM (Hidden Markov Models) на основе движка HHalign, что повышает качество выравнивания по сравнению с ClustalW. Применяет итеративные методы и профиль-профильные сравнения для улучшения результата.
Форматы ввода и вывода: FASTA, CLUSTAL, Stockholm, PHYLIP и др. Поддерживается на Linux, macOS и Windows, однако не имеет веб-интерфейса (работает через консоль; есть веб-интерфейс в бета-версии). Программа доступна как консольная утилита, веб-сервер и в виде библиотеки языка C.
Источники: