Нуклеотидный BLAST

В данном практикуме представлены задания, направленные на освоение нуклеотидного BLAST.

Определение функции и таксономии нуклеотидной последовательности

В практикуме 6 был произведен анализ хроматограммы секвенирования по Сэнгеру и получен консенсус для исследуемой последовательности (seq). Чтобы установить таксономическую принадлежность и функцию данной последовательности был использован blastn (т.к. мало известно про эту последовательность, в том числе является ли она участком белок-кодирующего гена или нет).

Параметры запуска: database: nr/rt , max target sequences: 100, expect threshold: 0.01, word size: 11.

Результаты: с выдачей можно ознакомиться по ссылке.

Функция: данная последовательность почти наверняка является участком гена субъединицы I цитохром оксидазы С (COI). Этот факт подтверждает как выдача blast'а, в которой COI присутствуют с высоким E-value, так и тот факт, что ген COI широко используется в в таксономических исследованиях как баркод, используемый для определения микроэволюции (позволяет различать организм до вида).[1]

Tаксономия: данная последовательность с высокой вероятностью принадлежит голожаберному моллюску (Nudibranchia) из надсемейства Flabellinidae (100 лучших находок), семейства Coryphellidae (91 лучшая находка). Можно предположить, что последовательность принадлежит Coryphella verrucosa (Flabellina verrucosa), так как наиболее высокие по Identity находки в blastn принадлежат именно этому виду.

Поиск генов белков в неаннотированной нуклеотидной последовательности

Для работы был выбран контиг из сборки генома Carassius auratus strain Wakin практикума 8 (tig00215483).

Использовался blastx (т.к. необходим поиск по генам в данном контиге, то лучше будет протранслировать его в пептид и поискать гомологичные). Параметры: database: swissprot (по достоверно существующим белкам), organism: exclude Carrasius auratus (taxid:7957), expect threshold: 0.01 (находки с хорошей гомологией), word size: 6 (контиг довольно большой и искать более подробно было бы неоправданно долго).

С выдачей можно ознакомиться по ссылке.

Попадания основных типов находок на запрос (некоторые повторяющиеся находки для разных организмов не показаны)

В лучших 50 находках выдачи присутствуют 4 основых типа белков:

Для ознакомления, по ссылке доступны выравнивания представителей этих 4х классов белков на запрос.

Несмотря на то, что лучшим E-value характеризуются Tc1- и Tcb1- транспозазы, по таксономической близости и выравниванию с большей уверенностью я бы предположил наличие гена beta-2-microglobulin precursor в выбранном контиге.

Интепретация карты локального сходства гомологичных хромосом двух бактерий

Для сравнения были выбраны геномы двух представителей класса Альфа-протеобактерии с Complete genome assembly: Rickettsia rickettsii str.Iowa (NC_010263.3 и Rickettsia prowazekii str. Chernikova (NC_017049.1).

Dotplot (OY: R.prowazekii,OX: R.rickettsii)

Используя blast2seq, легко получить карту локального сходства двух последовательностей. По представленному выше dotplot'у можно видеть, что выбранные последовательности очень сходны (почти нет шума), однако на участке 625K-760K наблюдаются крупные перестройки. В данной зоне произошла инверсия участка, однако посередине этого инвертированного участка наблюдается восстановление ориентации последовательности, что можно объяснить двумя событиями инверсии.

References
  1. Li Q. et al. DNA barcoding reveal patterns of species diversity among northwestern Pacific molluscs //Scientific Reports. – 2016. – Т. 6. – №. 1. – С. 1-17.
free counter