Главная
Семестр 1
Семестр 2
Семестр 3
Семестр 4
О себе
Ссылки

Онлайн BLAST

Для начала мне надо было найти с помощью megablast организм (бактерию), частью генома которого является выданная мне последовательность из 300 нуклеотидов. Для поиска я пользовалась параметрами по умолчанию, установив только в качестве базы для поиска refseq_genomic, в поле Organism: bacteria (taxid:2), и убрала галочку с пункта "Low complexity regions". Megablast удобен как раз для такого рода поисков, откуда взят участок генома.

Процесс поиска происходил порядка 10 минут. В результате была найдена бактерия Candidatus Blochmannia floridanus. Эта бактерия является эндосимбионтом некоторых клеток муравьев. Хромосома одна, кольцевая.

Затем мне надо было выбрать такой белок человека, для которого идентификатор в Swiss-Prot и моя фамилия начинаются с максимального количества одинаковых букв. Для этого я ввела следующий запрос:
infoseq sw:kh*_human -only -name -desc -out proteins
Таких белков оказалось 8 (список) и ни один из них не начинается с "kha", так что я выбрала прямо первый "KHK_HUMAN". Чтобы получить файл с самой последовательностью я выполнила следующую команду:
seqret sw:khk_human -auto
Потом с помощью сайта ENA найти гомологов выбранного белка в геноме Африканского слона (Loxodonta africana). Для поиска нужна нуклеотилная последовательность. Чтобы ее добыть я сначала ввела такой запрос:
entret sw:khk_human -auto
Затем из полученного файла узнала идентификатор последовательности мРНК в EMBL и загрузила еще один файл, в котором есть уже нужная нуклеотидная последовательность, такой командой:
entret embl:x78678 -auto

Поиск на сайте ENA выдал всего три результата (рис.1). Как можно заметить, наилучшая находка имеет e-value 10-116, длину 344 и identity 88%, что говорит о достаточно близком родстве. Найденный ген в геноме слона имеет координаты [40628806..40634573], всего 2 интрона.

Рис 1. Результат поиска.


Для выполнения последующих заданий мне нужно было выбрать последовательность, кодирующую тРНК из моей бактерии (Cytophaga hutchinsonii). Воспользовавшись указанием, я скачала файл, относящийся к моей бактерии, с расширением .frn. Из него я выбрала последовательность тРНК (переносящую аланин) и поместила в отдельный файл. Затем я выяснила название порядка, к которому относится моя бактерия, - Cytophagales.

Далее поиск гомологов того же порядка тремя разными способами:
Способ I
Использовать алгоритм megablast. Параметры я использовала, как в первом задании, но поиск не по всем бактериям, а только по соответствующему порядку. В результате нашлась только оригинальная последовательность (разумеется, e-value < 10-3). Это можно объяснить тем, что настолько близких гомологов, чтобы их нашел megablast, у этой тРНК нет.
Способ II
Использовать алгоритм blastn с параметрами по умолчанию. Нашлось 95 совпадений, из которых 69 с e-value < 10-3. Этот способ в отличие от первого все-таки является настоящим способом поиска гомологов.
Способ III
Использовать алгоритм blastn с длиной слова = 7, match/mismatch = 1/-1 (максимально чувствительные параметры, доступные на сайте). Находок 87, среди которых, например нет самых верхних (по e-value) в способе II. С e-value < 10-3 - 64. Различия не очень существенные и чем вызваны, я не знаю. Я ожидала отличия в другую сторону, раз уж более чувствительная система.