Задание 1
Для поиска предполагаемой функции и таксономии фрагмента из практикума 6 был выбран алгоритм megablast с параметрами по умолчанию, так как предполагалось существование сильно схожей с данной последовательности, megablast же дает результаты с высоким сходством. Исходя из полученных результатов, можно предположить, что это субъединица 1 цитохромоксидазы Polycirrus medusa, так как этот результат имеет идентичность 100% при максимальном значении покрытия (95%). Подтверждает вывод taxonomy report.
Рис.1. Первые 15 результатов в выдаче megablast на запрос прочитанной последовательности
Рис.2. Taxonomy report по выдаче megablast на запрос прочитанной последовательности
Полная таксономия прочитанной последовательности: Eukaryota; Metazoa; Lophotrochozoa; Annelida; Polychaeta; Scolecida; Terebellida; Terebellidae; Polycirrus, Polycirrus medusa. Сам P.medusa является многощетинковым червем (см. рис.3).
Рис.3. Polycirrus medusa
Задание 2
Таблица 1. Сравнение трех алгоритмов blast. Запрос - полученная в практикуме 6 последовательность, область поиска ограничена родом Polycirrus.
Алгоритм | megablast | discontigious blast | blastn |
Число находок | 4 | 28 | 35 |
Минимальное покрытие | 94% | 68% | 1% |
Минимальная степень идентичности | 89% | 78% | 78% |
Максимальный E-value | 0.0 | 1e-142 | 2.5 |
Также нужно отметить, что если megablast и discontigious blast в качестве худшего результата выдают все равно субъединицу 1 цитохромоксидазы, то blastn худшим результатом дает ген рибосомальной РНК. Таким образом, megablast выдает наиболее близкие гомологи, discontigious blast выдает гомологичные, но менее сходные последовательности, а blastn может выдавать и в принципе негомологичные последовательности.
Задание 3
Для поиска были выбраны белки HSP7C_HUMAN, TERT_HUMAN и PABP2_HUMAN. Последовательности белков были взяты из Uniprot. Поиск гомологово осуществлялся с помощью программы tblastn.
Белок теплового шока
Рис.4. Список результатов для белка HSP7C_HUMAN
HSP7C_HUMAN относится к классу белков теплового шока, защищающих белки организма от денатурации в тех или иных стрессовых условиях, например, при высоких температурах или присутствии химических денатурирующих агентов. Так как данная система жизненно важна для функционирования клетки, логично предположить наличие гомологов у подавляющего большинства эукариотических организмов. Действительно, у X5 найдено 3 скаффолда с E-value = 0.0 и степенью идентичности >60%, что говорит о существовании гомологов.
Теломераза
Рис.5. Список результатов для белка TERT_HUMAN
Теломераза - фермент, восстанавливающий концевые последовательности хромосом эукариот (теломеры), что позволяет клеткам с активной полимеразой делиться практически неограниченно. Так как ни один результат поиска не позволяет говорить о себе как о гомологе человеческой теломеразы, было выполнено выравнивание последовательностей TERT_HUMAN и sсaffold-17.
Рис.6. Результат выравнивания последовательности белка TERT_HUMAN с последовательностью scaffold-17
Глядя на это выравнивание, можно предположить, что здесь присутствует условная гомология, так как выравнивание содержит большое число консервативных и функционально консервативных позиций, включая целые консервативные блоки. Покрытие составляет 49%.
Белок, связывающий поли-(А)-хвост мРНК
Рис.7. Список результатов для белка PABR2_HUMAN
Данный белок связывается с поли-(А)-хвостом мРНК и осуществляет ее транспорт из ядра и предохраняет ее от деградации, а также осуществляет циркуляризацию мРНК, что дает рибосоме возможность не диссоциировать после трансляции, а начинать ее опять через очень малый промежуток времени. Так как сложно сказать о гомологичности скаффолдов в полученном результате, было произведено выравнивание последовательностей PABR2_HUMAN и scaffold-100.
Рис.8. Результат выравнивания последовательности белка PABR2_HUMAN с последовательностью scaffold-100.
Исходя из результатов выравнивания, можно сделать вывод о присутствии в последовательности скаффолда гомологичного домена белка, судя по всему, ответственного за непосредственное связывание мРНК, так как функционально важные участки с большей вероятностью сохраняют свою последовательность. Покрытие составляет 38%
Задание 4
Для выполнения задания был выбран scaffold-59, длиной в 17200. megablast не дал результатов, поэтому использовался discontigious blast. Исходя из полученных результатов, можно предположить, что это гомолог гена MUC19 - гена, ответственного за синтез гликопротеида-компонента слизистого секрета.
Рис.9. Лучшие результаты выравнивания scaffold-59 с помощью discontigious blast.