Задание 1. Проверка гомологичности белков, найденных поиском по сходству
BLAST (англ.
Basic Local Alignment Search Tool - средство поиска основного локального выравнивания)
[1]
— семейство компьютерных программ,
служащих для поиска гомологов белков или нуклеиновых кислот, для которых известна первичная структура (последовательность) или её фрагмент.
[2]
В данном практикуме необходимо было отыскать гомологичные белки с помощью BLAST. Сначала был установлен порог E-value равный 10. В Swiss-prot
было найдено 9 белков с довольно низким E-value. Затем была уменьшена длина слова до 3. В этом случае нашлось намного больше белков и с
большим значением E-value (также в Swiss-Prot). Но и с этим параметром не нашлось белков с E-value больше единицы. Поэтому был проведен еще один сеанс
поиска, но в RefSeq. Здесь уже были найдены несколько белков с E-value больше 1. Результаты поиска вы можете видеть в таблице 1, приведенной ниже.
Таблица 1. Результаты поиска BLAST |
Номер |
ID/AC |
Название белка |
Coverage % |
Identity % |
E-value |
Гомологичность белку |
1 | Q58649.1 (оказался одной из версий исходного белка) | UPF0254 protein MJ1251 | 100 | 100.000 | 7.77e-120 | + |
2 | A9AB09.1 | UPF0254 protein MmarC6_1720 | 99 | 58.434 | 2.53e-63 | + |
3 | Q6LYQ3.1 | UPF0254 protein MMP0935 | 99 | 55.422 | 3.63e-61 | + |
4 | A6VFM6.1 | UPF0254 protein MmarC7_0182 | 99 | 56.627 | 9.86e-60 | + |
5 | Q8TZC1.1 | UPF0254 protein MK0012 | 94 | 41.250 | 5.25e-35 | + |
6 | Q50521.1 | UPF0254 protein MTH1148 homolog | 93 | 36.076 | 3.03e-28 | + |
7 | A2SU98.1 | UPF0254 protein Mlab_1743 | 97 | 32.927 | 5.30e-25 | + |
8 | WP_019376973.1 | MBL fold metallo-hydrolase [Virgibacillus halodenitrificans] | 71 | 29.600 | 1.4 | - |
9 | WP_051421596.1 | hypothetical protein [Paenarthrobacter nicotinovorans] | 60 | 22.857 | 3.9 | - |
10 | C4L854.1 | UDP-3-O-acylglucosamine N-acyltransferase | 50 | 23.529 | 0.83 | - |
Далее с помощью программы JalView эти последовательности были выравнены. Ниже вы можете видеть изображение фрагмента, полученного выравнивания.
Ссылка на проект JalView.
|
Рис. 1. Фрагмент множественного выравнивания. |
Для того чтобы понять гомологичны ли найденные последовательности, выравнивание было исследовано на наличие блоков достоверного выравнивания. Причем:
- длина блока составляет не менее 4 колонок;
- блок не содержит гэпов;
- концевые позиции блока абсолютно консервативны или функционально консервативны;
- в блоке достаточное число абсолютно консервативных позиций (не менее 35%);
- блок максимален по высоте и по ширине (т. е. нельзя увеличить блок добавлением еще одной последовательности или столбца с сохранением всех
свойств блока).
Ниже вы можете видеть изображения некоторых найденных блоков (выделены красным).
|
Рис. 2. Фрагмент множественного выравнивания белков, иллюстрирующий блок. |
|
|
Рис. 5. Фрагменты множественного выравнивания белков, иллюстрирующие блоки. |
На основе данных изображений можно сделать вывод о гомологичности исследуемых белков: гомологичны первые семь последовательностей из множественного
выравнивания. Соответственно это:
- Q58649.1 (версия исходного белка)
Задание 2. Описание крупных перестроек между парой белков, имеющих гомологичные участки (домены)
Для выполнения этого задания были выбраны следующие белки
[3]
, найденные с помощью Pham
[4]:
- Z9JPR1 (Z9JPR1_9MICO): Superoxide dismutase (Супероксиддисмутаза или СОД) из организма Brachybacterium phenoliresistens;
- A0A0G4G7T0 (A0A0G4G7T0_VITBC): Uncharacterized protein из организма Vitrella brassicaformis (strain CCMP3155)
Они содержат по два домена:
- Iron/manganese superoxide dismutases, alpha-hairpin domain (участок зеленого цвета);
- Iron/manganese superoxide dismutases, C-terminal domain (участок красного цвета)
Далее с помощью BLAST эти последовательности были выравнены при этом длина слова составила 2, E-value 1e-05, причем покрытие составило 73%, E-value 4e-40, а идентичность 37%. Ниже вы можете
видеть изображение - карту локального сходства, иллюстрирующую гомологию этих белков. (по оси Y - Z9JPR1, по X - A0A0G4G7T0, соответственно)
|
Рис. 3. Карта локального сходства |
На основе полученного изображения можно говорить о том, что во втором белке произошла дупликация двух доменов, а также делеции в некоторых местах
(заключены в фиолетовые кружки). Схематично последовательности можно избразить следующим образом:
|
Рис. 4. Архитектура белков |
Источники:
[1]: BLAST: Basic Local Alignment Search Tool;
[2]: Википедия. BLAST;
[3]: Uniprot;
[4]: Pham.