Множественные выравнивания

Проект Jalview

Скачать проект
Скачать последовательности гомологичных белков

Последовательности были получены с помощью команды seqret в 11 практикуме.

"Чистка"

Всего у меня было 512 последовательностей, из которых я сначала убрал повторяющиеся, затем схожие на 90%. После убрал все последовательности с вставками 2 аминокислоты и больше, но этого оказалось мало, поэтому после сортировки по "by pairwise identity" я убрал больше 75% снизу. В итоге осталось 16 последовательностей(также были убраны последовательности портящие на мой взгляд блоки).

Блоки

Мной было обнаружено 5 блоков разных размеров, последний из которых (249-351) я поделил на подблоки в размере 3 штук. Наличие нескольких блоков, один из которых имеет внушительные размеры безусловно сведительствует о гомологии. Блоком я считал кусок выравнивания, начинающийся с консервативной колонки и ею же заканчивающийся, причем расстояние между ними не более 6, причем внутри блока все должно быть более менее идентично. Подблоки разделены в блоке абсолютно негомологичными колонками.(криво отмечен первый блок, надо сместить его конец на 2 кислоты назад)

Блоки

Блоки 1

Блоки

Блоки 2