1. Выравнивания различных белков E. coli и B. subtilis

Были проведены 5 парных выравниваний гомологичных (точнее, с большой долей вероятности являющихся таковыми) и 5 пар негомологичных последовательностей белков в протеомах бактерий E. coli и B. subtilis, являющихся классическими модельныи организмами во многих областях биологии, а потому достаточно хорошо изученных. Результаты представлены в таблице. Для гомологичных последовательностей подбирались белки с одинаковой мнемоникой Uniprot, при этом с достаточно близкими длинами. Некоторые белки выбирались как обладающие на мой взгляд несколько большей вероятностью к высокой консервативности структуры (рибосомальные белки, факторы трансляции, ферменты цтк). Также подбирались белки различной длины - от совсем коротких (72 АК) до сравнительно длинных (909 АК). Наибольший процент идентчности из рассмотренных белков показали трансляционный фактор IF-1 и рибосомальный белок L19. С одной стороны, функции этих белков должны способствовать высокой консервативности их последовательностей (их работа мало зависит от изменений окружающей среды, к тому же строго специализирована). С другой стороны, белки имеют небольшой размер, что может понижать вероятность таких событий как делеции и вставки (как просто за счет меньшего числа возможных мест для возникновения мутации, так и за счет того, что изменение длины небольшого белка сильнее отразится на его свойствах, чем у длинного), а также немного повышать вероятность случайных совпадений в выравнивании. Близкие результаты оказались у белка, связанного с синтезом аминокислот, а также фермента, участвующего в цикле трикарбоновых кислот. Самый низкий процент идентичности был по белку, участвующему в синтезе пуриновых нуклеотидов.

Негомологичные белки для повышения процента сходства подбираись двумя способами: 1. Выполняющие сходные функции и имеющие близкую длину 2. Имеющие одинаковую длину. В сучае глобального в выравнивания сходство оказалось больше у близких по функциям белков, хотя это вполне может быть совпадением. По локальным выравниваниям результаты вышли несколько неожиданными. Например, по проценту сходства наибольший результат был в паре белка с днк-полимеразной активностью и компонента жгутика бактерии. Правда процент покрытия для них был минимальным из представленных, а также крайне мало сходство на глобальном выравнивании, что указывает с большой вероятностью на совпадение. Стоит отметить, что оба белка были достаточно небольшой длины. В то же время, максимальный процент покрытия дала еще одна пара явно далеких друг от друга белков - ДНК-связывающнего белка и фермента, участвующего в синтезе триптофана. В целом по выравниваниям негомологичных белков вряд ли имеет смысл делать какие-то выводы, даже в случае сходных функций (речь не идет об особых случаях, когда для выполнения функции структура белка должна иметь строго определенный вид и у последовательностей будет выраженное конвергентное сходство на локальном выравнивании)

2. Множественное выравнивание

Объектом был выбран белок p53, играющий важную роль в регуляции клеточного цикла и подавления развития злокачественных образований. Для выравнивания были выбраны последовательности белка, принадлежащие человеку, домовой мыши, крысе, быку и рыбке Данио рерио (все животные являются классическими модельными объектами). Было построено множественное вырвавнивание, из которого были взяты наиболее далекие друг от друга последовательности (Danio rerio и человек), затем между ними были построены глобальное и локальное выравнивания. Некоторые различия полученных выравниваний приведены на изображениях ниже. Различия между локальным и глобальным выравниваниями присутствуют только вначале и вконце последоательности (что неудивительно, ведь локаьное выравнивание работает с наиболее похожим фрагментом), в выравнивании же, взятом из множественного, дополнительно присутствуют группы гэпов: 1. 194 позиция в выравнивании - одиночный гэп в обеих последовательностях - в отрыве от других последовательностей множественного выравнивания бессмысленен. 2. 324-330 - 7 гэпов у Homo sapiens в множественном выравнивании и только 3 гэпа (326-328) в парных; последовательность Danio rerio на этом участке в выравниваниях одинаковая. 3. В множественном выравнивании на 388-390 позициях у Homo sapiens гэпы, и в следующих двух десятках позиций гэпов нет, тогда как в парных выравниваниях три гэпа находятся на 396-398 позициях. Последовательность Danio rerio снова одинакова на данном участке во всех выравниваниях и не содержит гэпов.

al1al2al3
JVP проект