Таблица 2. Характеристики глобального парного выравнивания трёх пар белков
Protein name
ID1
ID2
Score
Identity, %
Similarity, %
Gaps
Indels
Coverage 1
Coverage 2
Thymidine kinase
KITH_ECOLI
KITH_BACSU
179,0
29,9%
50,0%
17
6
86,83%
88,72%
Phosphomannomutase
MANB_ECOLI
MANB_BACSU
50,0
23,7%
32,2%
58
8
26,54%
34,53%
Glycerol-3-phosphate dehydrogenase [NAD(P)+]
GPDA_ECOLI
GPDA_BACSU
667,5
40,3%
63,9%
3
2
99,69%
95,36%
3. Результат применения программ выравнивания к неродственным белкам
Таблица 3. Характеристики глобального и локального парных выравниваний пары белков
Выравнивание
ID1
ID2
Score
Identity, %
Similarity, %
Gaps
Indels
Coverage 1
Coverage 2
Глобальное
MALF_ECOLI
GLCT_BACSU
26,5
9,1%
16,0%
417
18
-
-
Локальное
MALF_ECOLI
GLCT_BACSU
45,0
20,7%
34,7%
39
5
16,54%
41,99%
Вес выравниваний достаточно небольшой. В глобальном выравнивании имеется большое количество гэпов: 417, учитывая, что длины белков
составляют 514 и 281 аминокислотный остаток. Связано это с тем, что длина одного белка в два раза больше длины второго. Локальное выравнивание
дает более полезную оенку, так как не учитывает разности в длине, однако оно покрывает всего 16,54% и 41,99% длины от большего и меньшего белков соответственно.
Таким образом можно понять, что белки не являются родственными.
4. Множественное выравнивание белков и импорт в Jalview
При поиске белков с мнемоникой KITH выдалось 264 результата.
Рекомендованное имя белка: Thymidine kinase. Для выравивания на kodomo
программой muscle были выбраны: kith_human, kith_mouse, kith_hhv1,
kith_dictd, kith_staan, kith_ecoli, kith_bacsu.
Ссылка на выравнивание.
Наряду с белками эу- и прокариот был выбран белок вируса герпеса,
который сильно отличается длиной от остальных, из-за этого присуствует
много гэпов. Также доля совпадающих аминокислот стремится к нулю, потому
что большая часть сходных с остальными белками аминокислот - самые
консервативные (то есть одинаковы у всех). На основании таких данных я
не могу судить о гомологичности белка KITH_HHV1 с остальными тимидин-киназами.
В этом выравнивании присутствует достаточно много сходных участков, но не все
можно назвать консервативными.
На самом деле если бы не было вирусного белка,
то данные выравнивания были бы намного информативнее. Поэтому сделаем новое
выравнивание без него.
Ссылка на новое выравнивание.
Достаточно большая концентрация гомологичных аминокислот на участках: 19-61,
100-110, 125-143, 148-175 и 178-203. В то время как начало выравнивания и конец -
сильно различаются у разных организмов.