Что было сделано:
- Было выбрано 10 пар белков: 5 из протеома штамма K12 кишечной палочки и 5 из протеома штамма 168 сенной палочки, они были выбраны так, что 5 пар были гомологичны, и 5 - нет.
- При помощи программ needle и water из пакета EMBOSS были проведены глобальные и локальные выравнивания всех пар белков. Из этого исследования был сделан вывод, как понять по выравниванию, какие белки гомологичны, а какие - нет.
- Были выбраны последовательности 6 гомологичных белков и проведено их множественное выравнивание при помощи программы Jalview
- Далее были выбраны 2 наиболее отличающихся белка. Их последовательности были сохранены в формате фаста и было проведено их выравнивание при помощи программ needle и water
- Были найдены 3 различия между этими выравниваниями
Часть 1
Глобальное выравнивание
Для последовательностей гомологичных белков в данной выборке процент идентичности от 24,8 для последовательности Aminodeoxychorismate lyase до 54,6 для последовательности Formate-dependent phosphoribosylglycinamide formyltransferase , процент похожести от 40,6 до 69,2 (для тех же последовательностей). Для негомологичных белков процент идентичности колеблется между 4,6 для выравнивания последовательностей Phosphoheptose isomerase и HTH-type transcriptional repressor FatR и 16,8 для выравнивания последовательностей белков Putative type II secretion system protein L и Nuclease SbcCD subunit , процент похожести - между 9,6 до 32,1 для тех же выравниваний.
Локальное выравнивание
Для последовательностей гомологичных белков в данной выборке процент идентичности от 26 для последовательности Aminodeoxychorismate lyase до 56,9 для последовательности Formate-dependent phosphoribosylglycinamide formyltransferase , процент похожести от 43,8 до 71,5 (для тех же последовательностей). Для негомологичных белков процент идентичности колеблется между 19,8 для выравнивания последовательностей DNA polymerase III subunit tau и Serine/threonine-protein kinase PrkC и 29,5 для выравнивания последовательностей белков L-fucose mutarotase и Protein CgeA, процент похожести - между 34,4 до 45,9 для тех же выравниваний.
Различия между выравниваниями гомологичных и негомологичных белков
Стоит отметить, что для гомологичных белков процент покрытия локального выравнивания очень большой - больше 85%, тогда как для негомологичных он меньше 60. Также глобальные выравнивания гомологичных последовательностей содержат намного меньше гэпов, чем выравнивания негомологичных. Процент идентичности и похожести для глобальных выравниваний гомологичных белков также выше аналогичных процентов для негомологичных. Процент идентичности локальных выравниваний не позволяет судить о гомологичности, у негомологичных белков он может быть выше, чем у гомологичных.
Таблица с отчётом.
Часть 2
В программе Jalview было выполнно множественное выравнивание 6 белковых последовательностей Formate-dependent phosphoribosylglycinamide formyltransferase
![alnm](alnm.png)
Для дальнейшего изучения были выбраны последоваетльности из организмов Bifidobacterium longum и Xanthomonas oryzae pv. oryzae.
Последовательности белка из этих организмов были выровнены программами needle и water и были найдены отличия между полученными выравниваниями:
![muscle_needle](muscle_needle.png)
![muscle_water](muscle_water.png)
![muscle_needle_2](muscle_needle_2.png)
Так как область покрытия локального выравнивания для гомологичных белков очень высока, оно почти не отличается от глобального, тогда как при множественном выравнивании возникают лишние гэпы, в наличии которых в основном и состоит отличие