Поиск по сходству. BLAST, E-value


1. Проверка гомологичности белков, найденных поиском по сходству.

Табл.1 - Характеристики выравниваний

ID/AC Name Coverage Identity % E-value Homology
1 AFH91095.1 Riboflavin biosynthesis protein [Corynebacterium pseudotuberculosis 31] 100 100 исходный белок
2 Q59263.1 Riboflavin biosynthesis protein RibF 96 54 2е-121 +
3 P73651.1 Riboflavin biosynthesis protein RibC 81 36 8e-55 +
4 P0AG42.1 Riboflavin biosynthesis protein RibF 96 31 1e-48 +
5 Q7NBZ0.1 Trifunctional protein RibF/MnmA 92 26 1e-20 +
6 A4IT50.1 Bifunctional riboflavin kinase/FMN phosphatase 43 28 3e-15 -
7 A4QQ05.3 Riboflavin kinase 39 28 1е-09 +
8 A1DG00.1 Riboflavin kinase 39 26 4e-06 +
9 Q58436.1 Phosphopantetheine adenylyltransferase 17 27 3.0 -
10 F4IUG9.1 Myosin-13 18 36 9.3 -


Рис.1. Фрагмент выравнивания последовательностей белков с отмеченными блоками.

Ссылка на Jalview-проект

Комментарии о гомологичности находок:

* Рассматриваемые белки были найдены с помощью поиска в BLAST (Database – UniProtKB/Swiss-Prot, остальные параметры были оставлены по умолчанию). Возникли небольшие проблемы с поиском белка, имеющего большое E-value, поэтому белок A1DG00.1 (E-value=3.0) был найден за счет введения ограничений - поиск вёлся исключительно среди Archaebacteria.

Я полагаю, что из приведённых белков гомологичны 1, 2, 3, 4, 5 и 7, 8 белки.

2. Крупные перестройки между парой белков, имеющих гомологичные участки (домены):


Рис.2 Карта локального сходства белков AFH91095.1 (Ox) и A1DG00.1 (Oy)

Комментарии:

  1. Для исследования были выбраны белки AFH91095.1 (Riboflavin biosynthesis protein) и A1DG00.1 (Riboflavin kinase) из задания 1. Эти белки выполняют схожие функции в организме, однако сравнительно слабо гомологичны, чем и привлекли моё внимание.
  2. Из приведённой выше карты видно, что белки действительно слабо схожи по строению: ~2/5 аминокислотной последовательности одного белка не имеет общих участков с другим.
  3. На основе привеённой карты можно также предположить, что в процессе эволюции белка AFH91095.1 произошла дупликация: участок последовательности белка A1DG00.1, стоящий практически в конце (158-171 а.к.о.) повторяется в белке AFH91095.1 дважды - в конце (~290-310 а.к.о) и в начале последовательности (~105-118 а.к.о).
    © Kozyulina Svetlana 2017