Учебный сайт Титовой Анастасии
ГЛАВНАЯ СТРАНИЦА
СЕМЕСТРЫ
ОБО МНЕ
КОНТАКТЫ
САЙТ ФББ
Поиск по сходству. BLAST, E-value

Задание 1. Проверка гомологичности белков, найденных поиском по сходству

BLAST (англ. Basic Local Alignment Search Tool - средство поиска основного локального выравнивания)[1] — семейство компьютерных программ, служащих для поиска гомологов белков или нуклеиновых кислот, для которых известна первичная структура (последовательность) или её фрагмент.[2] В данном практикуме необходимо было отыскать гомологичные белки с помощью BLAST. Сначала был установлен порог E-value равный 10. В Swiss-prot было найдено 9 белков с довольно низким E-value. Затем была уменьшена длина слова до 3. В этом случае нашлось намного больше белков и с большим значением E-value (также в Swiss-Prot). Но и с этим параметром не нашлось белков с E-value больше единицы. Поэтому был проведен еще один сеанс поиска, но в RefSeq. Здесь уже были найдены несколько белков с E-value больше 1. Результаты поиска вы можете видеть в таблице 1, приведенной ниже.
Таблица 1. Результаты поиска BLAST
Номер ID/AC Название белка Coverage % Identity % E-value Гомологичность белку
1 Q58649.1 (оказался одной из версий исходного белка) UPF0254 protein MJ1251 100 100.000 7.77e-120 +
2 A9AB09.1 UPF0254 protein MmarC6_1720 99 58.434 2.53e-63 +
3 Q6LYQ3.1 UPF0254 protein MMP0935 99 55.422 3.63e-61 +
4 A6VFM6.1 UPF0254 protein MmarC7_0182 99 56.627 9.86e-60 +
5 Q8TZC1.1 UPF0254 protein MK0012 94 41.250 5.25e-35 +
6 Q50521.1 UPF0254 protein MTH1148 homolog 93 36.076 3.03e-28 +
7 A2SU98.1 UPF0254 protein Mlab_1743 97 32.927 5.30e-25 +
8 WP_019376973.1 MBL fold metallo-hydrolase [Virgibacillus halodenitrificans] 71 29.600 1.4 -
9 WP_051421596.1 hypothetical protein [Paenarthrobacter nicotinovorans] 60 22.857 3.9 -
10 C4L854.1 UDP-3-O-acylglucosamine N-acyltransferase 50 23.529 0.83 -
Далее с помощью программы JalView эти последовательности были выравнены. Ниже вы можете видеть изображение фрагмента, полученного выравнивания. Ссылка на проект JalView.
Рис. 1. Фрагмент множественного выравнивания.
Для того чтобы понять гомологичны ли найденные последовательности, выравнивание было исследовано на наличие блоков достоверного выравнивания. Причем:
    - длина блока составляет не менее 4 колонок;
    - блок не содержит гэпов;
    - концевые позиции блока абсолютно консервативны или функционально консервативны;
    - в блоке достаточное число абсолютно консервативных позиций (не менее 35%);
    - блок максимален по высоте и по ширине (т. е. нельзя увеличить блок добавлением еще одной последовательности или столбца с сохранением всех свойств блока).
Ниже вы можете видеть изображения некоторых найденных блоков (выделены красным).
Рис. 2. Фрагмент множественного выравнивания белков, иллюстрирующий блок.
Рис. 5. Фрагменты множественного выравнивания белков, иллюстрирующие блоки.
На основе данных изображений можно сделать вывод о гомологичности исследуемых белков: гомологичны первые семь последовательностей из множественного выравнивания. Соответственно это:
  • Q58649.1 (версия исходного белка)
  • A9AB09.1
  • Q6LYQ3.1
  • A6VFM6.1
  • Q8TZC1.1
  • Q50521.1
  • A2SU98.1

Задание 2. Описание крупных перестроек между парой белков, имеющих гомологичные участки (домены)

Для выполнения этого задания были выбраны следующие белки[3] , найденные с помощью Pham[4]:
  • Z9JPR1 (Z9JPR1_9MICO): Superoxide dismutase (Супероксиддисмутаза или СОД) из организма Brachybacterium phenoliresistens;
  • A0A0G4G7T0 (A0A0G4G7T0_VITBC): Uncharacterized protein из организма Vitrella brassicaformis (strain CCMP3155)
Они содержат по два домена:
  • Iron/manganese superoxide dismutases, alpha-hairpin domain (участок зеленого цвета);
  • Iron/manganese superoxide dismutases, C-terminal domain (участок красного цвета)
Далее с помощью BLAST эти последовательности были выравнены при этом длина слова составила 2, E-value 1e-05, причем покрытие составило 73%, E-value 4e-40, а идентичность 37%. Ниже вы можете видеть изображение - карту локального сходства, иллюстрирующую гомологию этих белков. (по оси Y - Z9JPR1, по X - A0A0G4G7T0, соответственно)
Рис. 3. Карта локального сходства
На основе полученного изображения можно говорить о том, что во втором белке произошла дупликация двух доменов, а также делеции в некоторых местах (заключены в фиолетовые кружки). Схематично последовательности можно избразить следующим образом:
Рис. 4. Архитектура белков

Источники:

[1]: BLAST: Basic Local Alignment Search Tool;
[2]: Википедия. BLAST;
[3]: Uniprot;
[4]: Pham.

Titova Anastasiya, 2017 ©