Исследование возможностей множественного выравнивания
Написание программы для сравнения множественных выравниваний
Плодом труда Артема Тюкаева, Якова Коробицына, Матвея Киселева и моего стала программа alignment_comparison.py, доступная на GitHub по ссылке. Инструкция по запуску программы представлена там же, в README, а также может быть вызвана опцией -h (способ вызова справки также описан в README). Лично я реализовал придуманный общими усилиями алгоритм в Python, и принимал непосредственное участие в отладке.
Для тестирования программы я для начала нашел несколько гомологичных белков программой BLAST. В качестве белка запроса я выбрал субъединицу 8А цитохром-с-оксидазы человека. Я выбирал белок запроса по приципу высокой консервативности (я предположил, что выбранный белок ей обладает) и небольшой длины. Среди белков найденных BLAST были такие же белки у других организмов и другие субъединицы цитохром-с-оксидазы (8B и 8С). Затем я скачал последовательности найденных белков в формате FASTA и выравнял их в программе JalView алгоритмом Muscle и алгоритмом TCoffee. Ссылка на проект JalView. Затем я использовал программу на полученных выравниваниях и получил такой файл вывода:
F1-L1 F2-L2
10-17 10-17
29-34 29-34
43-78 42-77
Действительно, взглянув на выравнивания, видно, что программа обнаружила нужные блоки правильно. Тестирование считаю успешным.