Определение функции и таксономии нуклеотидной последовательности
Для выполнения этого задания была использована нуклеотидная последовательность, полученная из хроматограммы в 6 практикуме:
Ссылка
Для определения того, кому может принадлежать эта последовательность, необходимо было воспользоваться сервисом BLAST.
Нужно было выбрать, по какому из алгоритмов blastn начать поиск. Так как мы ничего не знаем о том, какие функции выполняет
эта последовательность и кому она принадлежать(и консервативная ли она), я не вижу смысла использовать megablast. Именно из-за
этого я решил использовать blastn. Параметры запуска я предпочел оставить дефолтными:
Выдача:
Я посчитал, что для аннотации достаточно первых 8 находок.
Судя по выдаче, консенсусная последовательность с большой вероятностью
принадлежит Pharyngocirrus tridentiger и является частью гена, кодирующего 18S рРНК. Я поинтересовался, к какому типу рибосом она принадлежит, и
с помощью википедии узнал, что 18S rRNA образует вместе с белками малую субъединицу 80S рибосомы (встречается, как я знаю, только у эукариот).
Pharyngocirrus tridentiger - принадлежит к многощетинковым червям(полихетам).
Ближайшие находки (Saccocirrus krusadensis и Saccocirrus jouinae)
также принадлежат к Polychaeta, и даже принадлежат к одному семейству -
Saccocirridae.
Первые 8 находок, полученные с помощью BLAST
Поиск генов белков в неаннотированной нуклеотидной последовательности
Я взял контиг Gallus gallus (Красная джунглевая курица)
Ссылка на контиг
Фотография Gallus gallus, взятая из
википедии:
Я провёл поиск по базе данных swissprot. Это было сделано из соображений того, что там меньше белков и поиск пройдёт быстрее, а при малом числе
находок можно провести поиск по Non-reduntant protein sequences. Но, как мне показалось, выдача достаточно достоверная и с достаточным числом белков.
Выдачу Blastx вы можете посмотреть, перейдя по
ссылке
Рассмотрев выдачу Blast, можно сделать предположение, что в контиге содержался ген, или участок гена (скорее всего это целый ген
, так как в Uniprot написано, что этот белок имеет
в своем составе около 420 аминокислот, а выравнивания blastx проиходили по длине 415-420 аминокислот), кодирующий белок нуклеопорин P42.
Интепретация карты локального сходства гомологичных хромосом двух бактерий
Необходимо было выбрать геномы 2 бактерий, принадлежащих к одному роду, но разных видов. Я взял
геномы
Alteromonas australica и
Alteromonas naphthalenivorans.
AC записей: NZ_CP008849 и NC_015554 соответственно.
Карта локального сходства, полученная при сравнении геномов:
Достаточно интересный результат. Получить что-то интересное вышло не сразу, но всё же повезло.
На карте достаточно хорошо видно, что произошло минимум две инверсии(по координатам: 2M-2,5M и 3,8M-4,3M относительно бактерии "по оси X") . Следует отметить, что разрыв на карте не играет большой роли в сравнении хромосом, так как они кольцевые, а не
линейные. Гораздо важнее, что этот "разрыв" повернут на 180 градусов относительно того, что мы могли бы ожидать.
Меня заинтересовала инверсия "посередине" карты:
Дело в том, что здесь, как я думаю, было минимум 2 инверсии, причем они могли пройти 2 разными путями(зелёная и синяя линии на картинке ниже). В случае, отмеченном зелёным,
произошло 2 инверсии на 2 близких участках, тогда как синим отмечена ситуация, когда произошла инверсия на большом участке(≈500кб), и также имела место быть инверсия на меньшем участке
внутри большого. Причём во втором случае нельзя сказать (по крайней мере я не смогу точно утверждать) какая из инверсий была первее.
Результат, полученный при сранении, кажется достаточно интересным.