Учебный сайт Левина Ильи, 3-й семестр

Нуклеотидный BLAST

Задание 1

В этом задании нам необходимо предположить функцию нуклеотидной последовательности и таксономическое положение организма, из генома которого мы получили последовательность в практикуме про анализ данных секвенирования по Сэнгеру.

Что ж, мы вообще не знаем, что мы тут по Сэнгеру насеквенировали, и нам нужно просто в принципе понять, какую функцию полученная нуклеотидная последовательность выполняет и из генома какого организма она взята. Опираясь на всё это, я считаю, что в данной ситуации надо использовать blastn, так как нам нужно просто поискать хоть сколько-нибудь похожие на наш консенсус последовательности. Точности, требуемой для поиска рамок считывания или положения гена в геноме нам не нужно.

Параметры запуска:

Я специально уменьшил длину слова до 7, чтобы повысить точность поиска, все остальные параметры оставил по умолчанию.

Результаты поиска:

BLAST_results.png

Вероятнее всего, наша консенсусная последовательность, отсеквенированная на ББС МГУ, является неполной митохондриальной кодирующей ДНК, а именно гЕном, кодирующим 1-ю субъединицу цитохромоксидазы. Это стало понятно по определению и описанию находок, а также по их FEATURES. Выделена, скорее всего, из одного из Polycirrus sp., так как большинство самых лучших находок принадлежит именно этому роду полихет. Между делом, можно быть уверенными, что наша последовательность принадлежит полихете, так как абсолютно все находки BLAST'a принадлежат именно полихетам.

Так как первые четыре лучшие по весу находки принадлежат Polycirrus medusa, можно предположить, что именно из этого вида полихет и была выделена наша последовательность, но я бы не стал об этом уверенно заявлять, так как с этим видом конкурирует по качеству ещё ряд других видов.

Задание 2

В этом задании мне нужно взять один контиг или скеффолд из генома, который я рассматривал в прошлом практикуме, и поискать в нём с помощью BLAST какие-нибудь гены, кодирующие белки.

Для реализации этой задачи лучше всего подойдёт blastx, так как мы будем выравнивать транслированную нашу последовательность с белками из белковой базы данных, таким образом мы сможем понять, какие белки закодированы в нашей последовательности, что нам и нужно.

Параметры запуска:

Специально был исключён вид комнатной мухи, так как именно из неё был взят мой контиг, установлен фильтр по эукариотам и также уменьшено количество последовательностей в выдаче, дабы ускорить работу BLAST + уменьшил длину слова для увеличения точности поиска. Все остальные параметры были оставлены по умолчанию.

Результаты поиска:

BLAST_results_2.png

Как можно понять по описаниям находок, в нашем контиге закодирован как минимум один белок: NDRG (Differentiation-related gene protein (что именно значит "N" в аббревиатуре, я так и не понял)), так как большинство находок именно так и названы и в описании у них написано одно и то же. Функция этого белка такова: он задействован в гормональном ответе, процессе роста клеток и их дифференциации. У него есть ещё огромный перечень функций, чтение которого я оставлю опциональным. Взял я эту информацию из комментария в лучшей находке из выдачи.

Задание 3

В этом задании нам надо было построить карту локального сходства хромосом двух близких бактерий и описать крупные геномные перестройки, которые эта карта позволяет обнаружить.

Для построения карты локального сходства я взял полные сборки хромосом двух бактерий рода Enterococcus: E. faecium и E. hirae.

Использовал я megablast в совмещении с blast2seq для более точного построения карты. Параметры запуска:

Я немного уменьшил длину слова для того, чтобы точность построения карты была ещё выше, остальные параметры оставил по умолчанию.

Полученная карта:

Карта_локального_сходства.jpg

Как мы сразу можем заметить, больших диагоналей на карте получилось 2, но при этом они убывающие, а не возрастающие. То, что их получилось 2, там может объяснить тот факт, что хромосомы кольцевые, и разрыв одной из хромосом для секвенирования произошёл не в том месте, где произошёл разрыв другой. То, что они убывают, говорит нам об инверсии.

Инверсия - такая хромосомная перестройка, когда происходит поворот участка хромосомы (или всей хромосомы) на 180 градусов. В нашем случае мы можем наблюдать инверсию почти всей хромосомы (или факт, что в хромосоме, отложенной по оси ординат, секвенировали цепь, комплементарную той, которую секвенировали в хромосоме, отложенной по оси абсцисс).

Также мы можем заметить несколько вставок/делеций: