1. Определение таксономии и функций прочтённой нуклеотидной последовательности

Данная нуклетотидая последовательность, судя по всему, является частью гена, кодирующего 18S субъединицу риосомы Полихет. Самым лучшим выравниванием BLASTn определил выравнивание с геном 18S субъедицы многощетинкового червя Scoloplos acutissimus. Это также доказывает то, что организмы из следующих повеличине счета выравниваний также относятся к семейству Orbiniidae.


самое лучшее выравнивание


пять лучших выравниваний (организмы из них относятся к одному семейству Orbiniidae)

2. Сравние списка находок нуклеотидных последовательностей тремя разными вариантами BLAST

1) Был применен MegaBLAST без иземенинй каких-либо параметров. Десять лучших находок оказались следующими:

2) Был применен BLASTn со следующими параметрами (остальные по умолчанию): длина слова 7, счет- 1:-1. Получились следующие результаты:

3) Также был применен BLASTn с параметрами: длина слова 15, счет- 4:-5. Результаты следующие :

Выводы: во всех четырех опытах самой лучшей находкой оказалась с AC KR920030 (Scoloplos acutissimus voucher W.44175.001 18S ribosomal RNA gene, partial sequence). В опытах 2 и 3 находки до восьмой полнотью совпадают, однако результаты этих опытов сильно отличаются от находок MegaBLAST.

В митохондриальном геноме выбранного мной организма я выбрала ген некодирующей 5S рибосомальной РНК ( ссылка на последовательность). Алгоритм BLAST был применен к ней три раза:

1) Я применила BLASTn с параметрами длины слова 15 и счетом 1;-1:

2) BLASTn c параметрами длины слова 7 и счетом 4;-5:

3) BLASTn c параметрами длины слова 11 и счетом 4;-5:

Выводы: На самом деле, при применении к этой последовательности MegaBLAST находилаь лишь одна последовательность (соответственно из этого же организма). Поэтому я применяла BLASTn с разными параметрами. Как можно заметить, различия начинаются с шестой находки, а самой лучшей во всех случаях считается, как и в MegaBLAST, находка с полным митохондриальным геномом Dictyostelium citrinum.

3. Наличие гомологов трех белков в неаннотированном геноме

1) Для белка теплового шока (HSP71_YEAST) в данной сборке были найдены участки с достаточными для утверждения гомологии параметрами.
- файл с результатом работы TBLASN для белка теплового шока

2) Для тубулина тоже наблюдается гомология
-файл с результатом работы TBLASN для тубулина (TBB_NEUCR)

3) Далее я проверила наличие гомологии в данном неаннотированном геноме с белком митохондриальной цитратсинтазы. В этом случае можно утверджать наличие условной гомологии, так как участки совпадения не достаточно большого размера.
-файл с результатом работы TBLASN для митохондриальной цитратсинтазы (PRPC_EMENI)

4. Поиск гена белка в одном из контигов

Применив BLASTx к скэффолду-340, длина которого 122595 н., получились следущие находки (я выбрала наиболее удачные):
1) Лучшие по счету (score):

2) Лучшие по идентичности (ident):

Однако для описания я выбрала все же лучшую находку по счету, а именно гена 1 субьединицы АТФ-цитратсинтазы:
- ссылка на нуклеотидную последовательность
-ссылка на аминокислотную последовательность белка

*Сложилась довольно интересная сиутация: гомология цитратсинтазы с данной неаннотированной последовательностью практически отсутcвует, однако совершенно рандомно выбранный скэффолд оказался очень похож на последовательность, кодирующую белок, учавствующий в одном с ней каскаде реакций (цикле трикорбоновых кислот (Кребса)).

5. Карта локального сходства геномов двух бактерий


Я сравнивала геномы двух бактерий из рода Brucella: Brucella neotomae (NZ_UIGH01000002.1) и Brucella ovis (NZ_UFUD01000002.1). Как пожно увидеть на графике, у Brucella neotomae где-то между 540000 и 560000 нуклеотидами произошла крупная делеция. Также можно заметить, что произошли более маленькие делеции в конце генома.


© Nenartovich Marina 2017