Сравнение выдачи программ множественного выравнивания белков.

Для этого задания выравнивались Superoxide dismutase [Mn/Fe] из разных видов из рода Rickettsieae: Rickettsia typhi (strain ATCC VR-144 / Wilmington), Rickettsia conorii (strain ATCC VR-613 / Malish 7), Rickettsia prowazekii (strain Madrid E).

Использовались программы: Muscle, Probcons, Mafft, Clustal, Tcoffee со стандартными параметрами.(по порядку соответсвенно)('''Почему-то description с названием использованной программы у сформированных групп не сохраняетсяв проекте.''')

Ссылка на проект в Jalview

Так как изначально выбирались организмы из одного рода, все 5 программ сделали одно и то же множественное выравнивание (100% совпадение выдачи). Хоть и не вышло выявить разницу в работе программ, один факт стал неоспорим. Гомологичные белки в близкородственных организмах можно найти использую любую программу для выравнивания!

А вот другие выравнивания уже для сравнения работы программ:

Выранивалась так же Superoxide dismutase [Mn/Fe], но уже из:Escherichia coli (strain K12), Rickettsia bellii (strain RML369-C)Rickettsia bellii (strain RML369-C), Plasmodium malariae. Порядок программ остался тот же.

Ссылка на проект в Jalview.

Из выравнивания выравниваний видно, что в программах Muscle, Mafft и Clustal метионин в начале белка считается больше началом трянсляции белка, чем аминокислотой для выравнивания. Так же интересно что в Tcoffee очевидно большее значение имеет пара треонин-серин, чем пара пролин-валин.На участке 57-58 видна разница в колонке треонин-глутамат у Mafft и Clustal и треонин-лизин у всех остальных программ. В районе 75 позиции наблюдается разница в колонках глицин-изолейцин у Muscle, Probcons и Tcoffee и глицин-глутамин у остальных, а также сильно выделяется выравнивание Muscle:видимо значение simularity здесь больше, чем таковое значение identity у других программ. Далее еще одно отличие идёт в районе 147 позиции. Здесь пара аспарагин-глицин у Probcons и Tcoffee предпочтительней пары аспарагин-серин у других программ.(видимо по-разному рассматриваются свойтва аспарагина как аминокислоты) Далее в 166-167 позициях идёт расхождение в приоритете пар:метионин-треонин у Muscle и Clustal и аланин-глицин у остальных.(видимо выигрыш в весе выравнивания для этих пар разнится). Дальше на позиции 197-198 идёт разница в предпочтении гистидина(заряжен или ароматичен) в паре с "гидрофобным" аланином и полярным аспарагином(заряженность) у Muscle, Probcons и Tcoffee или заряженного лизина у остальных. И наконец, последнее различие в конце выравниваний - это положение терминальной пары. Возможно у Probcons и Tcoffee отдается меньшее предпочтение для выравниваний с инсерцией или делецией в самом конце последовательности (не желательно, чтобы последовательность в выравнивании заканчивалась гэпами)

Вывод: у Muscle самое лучшее множественное выравнивание, потому что метионин - начало белка; simularity круче identity(ведь в данном случае я брал неблизкородственные организмы, у которых могло накопиться много нейтральных или полезных мутаций в неконсервативных участках белка, а мутации в один нуклеотид могут вызывать замену аминокислот примерно в трети случаев); был предпочтен компромисс в выравнивании в виде гистидина (для аланина и аспарагина).