Нуклеотидный blast

Нуклеотидный blast

Задание 1

Для поиска предполагаемой функции и таксономии фрагмента из практикума 6 был выбран алгоритм megablast с параметрами по умолчанию, так как предполагалось существование сильно схожей с данной последовательности, megablast же дает результаты с высоким сходством. Исходя из полученных результатов, можно предположить, что это субъединица 1 цитохромоксидазы Polycirrus medusa, так как этот результат имеет идентичность 100% при максимальном значении покрытия (95%). Подтверждает вывод taxonomy report.

Рис.1. Первые 15 результатов в выдаче megablast на запрос прочитанной последовательности

Рис.2. Taxonomy report по выдаче megablast на запрос прочитанной последовательности

Полная таксономия прочитанной последовательности: Eukaryota; Metazoa; Lophotrochozoa; Annelida; Polychaeta; Scolecida; Terebellida; Terebellidae; Polycirrus, Polycirrus medusa. Сам P.medusa является многощетинковым червем (см. рис.3).

Рис.3. Polycirrus medusa

Задание 2

Таблица 1. Сравнение трех алгоритмов blast. Запрос - полученная в практикуме 6 последовательность, область поиска ограничена родом Polycirrus.

Алгоритм megablast discontigious blast blastn
Число находок 4 28 35
Минимальное покрытие 94% 68% 1%
Минимальная степень идентичности 89% 78% 78%
Максимальный E-value 0.0 1e-142 2.5

Также нужно отметить, что если megablast и discontigious blast в качестве худшего результата выдают все равно субъединицу 1 цитохромоксидазы, то blastn худшим результатом дает ген рибосомальной РНК. Таким образом, megablast выдает наиболее близкие гомологи, discontigious blast выдает гомологичные, но менее сходные последовательности, а blastn может выдавать и в принципе негомологичные последовательности.

Задание 3

Для поиска были выбраны белки HSP7C_HUMAN, TERT_HUMAN и PABP2_HUMAN. Последовательности белков были взяты из Uniprot. Поиск гомологово осуществлялся с помощью программы tblastn.

Белок теплового шока

Рис.4. Список результатов для белка HSP7C_HUMAN

HSP7C_HUMAN относится к классу белков теплового шока, защищающих белки организма от денатурации в тех или иных стрессовых условиях, например, при высоких температурах или присутствии химических денатурирующих агентов. Так как данная система жизненно важна для функционирования клетки, логично предположить наличие гомологов у подавляющего большинства эукариотических организмов. Действительно, у X5 найдено 3 скаффолда с E-value = 0.0 и степенью идентичности >60%, что говорит о существовании гомологов.

Теломераза

Рис.5. Список результатов для белка TERT_HUMAN

Теломераза - фермент, восстанавливающий концевые последовательности хромосом эукариот (теломеры), что позволяет клеткам с активной полимеразой делиться практически неограниченно. Так как ни один результат поиска не позволяет говорить о себе как о гомологе человеческой теломеразы, было выполнено выравнивание последовательностей TERT_HUMAN и sсaffold-17.

Рис.6. Результат выравнивания последовательности белка TERT_HUMAN с последовательностью scaffold-17

Глядя на это выравнивание, можно предположить, что здесь присутствует условная гомология, так как выравнивание содержит большое число консервативных и функционально консервативных позиций, включая целые консервативные блоки. Покрытие составляет 49%.

Белок, связывающий поли-(А)-хвост мРНК

Рис.7. Список результатов для белка PABR2_HUMAN

Данный белок связывается с поли-(А)-хвостом мРНК и осуществляет ее транспорт из ядра и предохраняет ее от деградации, а также осуществляет циркуляризацию мРНК, что дает рибосоме возможность не диссоциировать после трансляции, а начинать ее опять через очень малый промежуток времени. Так как сложно сказать о гомологичности скаффолдов в полученном результате, было произведено выравнивание последовательностей PABR2_HUMAN и scaffold-100.

Рис.8. Результат выравнивания последовательности белка PABR2_HUMAN с последовательностью scaffold-100.

Исходя из результатов выравнивания, можно сделать вывод о присутствии в последовательности скаффолда гомологичного домена белка, судя по всему, ответственного за непосредственное связывание мРНК, так как функционально важные участки с большей вероятностью сохраняют свою последовательность. Покрытие составляет 38%

Задание 4

Для выполнения задания был выбран scaffold-59, длиной в 17200. megablast не дал результатов, поэтому использовался discontigious blast. Исходя из полученных результатов, можно предположить, что это гомолог гена MUC19 - гена, ответственного за синтез гликопротеида-компонента слизистого секрета.

Рис.9. Лучшие результаты выравнивания scaffold-59 с помощью discontigious blast.


© Котюргин Александр, 2015