BLAST

1. Поиск гомологов

В практикуме 7 мною была описана субъединица бета ДНК-зависимой РНК полимеразы организма Natrinema halophilum. Соотвественно был произведен поиск гомологов данного белка. Поиск производился на сайте NCBI с помощью Protein BLAST. В настройках поиска были измены только база данных для поиска на Swiss-prot и максимально количество выдаваемых записей на 1000. Сам поиск был проведен по последовательности, взятой с сайта UniProt, так как использовать AC белка возможности не было в силу того, что запись о белке относится к базе данных TrEMBL.

Всего было найдено 812 записей голмологичных последовательностей. Результат в текстовом формате можно посмотреть здесь. Можно заметить, что все найденные значения E-value не превышают 0.05, что означает наличие гомологии между данными белками.

Далее с помощью Muscle было проведено множественное выравнивание первых 4 найденных последовтельностей, последовательности, взятой из средней части найденного списка и последовательности, по которой проводился поиск Однако при визуализации с помощью Jalview стало очевидно, что есть одна последовательность, отличающаяся от остальных. Эта последовтельность принадлежит орагнизму Eremothecium gossypii и сама по себе больше по длинне чем в среднем остальные. Видимо у белка данного организма присутсвует структурно-функциональная часть, которой нет у прочих. Так, длинна этой последовательности 1222, а последовательности, по которой она была найдена всего лишь 609. Такое отличие становится логичным, при взгяде на таксономию организмов, которым прнадлежат данные последовательности. Ведь все последовательности, кроме отличающейся принадлежат арехеям, а данная принадлежит эукариотичсекому организму из таксона Fungi. Причем, безусловно, протяженная часть этой структуры все же гомологична всем остальным. Однако, логично, что присутсвует довольно длинная часть, которая не выравнивается ни с какими остальными. Поэтому я решила исключить данную последовательность из итогового множественного выравнивания. Скачать итог обработки в Jalview.

2.Поиск гомологов вирусного белка, вырезанного из полипротеина

Мною был найден полипротеин, принадлежащий Human rhinovirus C. Он имеет ID в базе UniProt POLG_HRV15 и AC E5D8F2. Среди белковых продуктов данного протеина есть и протеаза 3С. Именно ее я и выбрала для дальнеших выравниваний.

С помощью descseq был вырезан необходимый участок полипротеина. Далее аналогично пункту 1, был произведен поиск в BLAST. Посмотреть результат. Заметно, что значение E-value тут также не достигает 0.05, что говорит о гомологии данных последовтельностей. Из этого списка было отобрано 5 первых последовтельностей. Далее обработка последовтельностей была проведена аналогично пункту 1, однако в Jalview были удалены все части последовтельностей множественного выравнивания, раположенные до и послей вырезанной из исходного полипротеина. Файл с результатом выравнивания.

3. Исследование зависимости E-value от объёма банка

В пункте 2 при поиске было найдено 45 гомологичных последовтельностей, при сужении поля поиска до поиска в рамках таксона вирусов находок также было 45. Однако E-value при поиске по всему Swiss-prot cоставяет 2e-124, тогда как при поиске с указанием таксономической группы поиска E-value составляет 9e-126. Отношение данных величин равное 33.3 отражает, что данные о вирусных белках занимают в Swiss-prot около 0.03 части.