Использование Blast

Настройки поиска

Выдача

Выбрала 6 находок с разными процентами совпадния и загрузила их в Jalview.

Ссылка на выравнивание

Гомологи белка из вирусного полипротеина

ID: POLG_ASGVP

AC: P36309

OS: Apple stem grooving virus (strain P-209) (ASGV)

Выбранный FT: название Coat protein; координаты 1869..2105

Ссылка на последовательность белка

При загрузке последовательности в Blast (с такими же параметрами, как были в первом заданиие) на выход я получила всего три находки, поэтому загружаю в Jalview только их.

Ссылка на выдачу

Ссылка на выравнивание

Зависимость E-value от объема банка

Ссылка на выдачу

Для второй последовательости (Q6PLS1.1) значение E-value изменилось с 7е-155 на 3е-156, то есть уменьшилось. Из этого мы можем сделать вывод, что при уменьшении базы данных E-value тоже уменьшается. Доказывается это по формуле вычисления E-value=m*n*2^-B, где m-длина последовательности, n- размер базы данных, следовательно E-value имеет прямую зависимость от размера базы данных. Делим значение второго E-value на первое: 3е-156/7е-155=0.043 (примерно 4%). Из этого следует, что доля вирусных белков в Swissprot состовляет 4%.

Сравнение интерфейсов Blast

Я сравнила визуал Blast в NCBI, EBI и UniProt. Такие особенности я отметила для себя:

NCBI: пока делала первые три задания привыкла к интерфейсу, довольно наглядная страница запроса и быстрый поиск;

EBI: единственное преимущество для меня- поиск по шагам, но соврешенно неудобный расширенный поиск, очень медленная работа и необходимость вручную обновлять страницу; так же удобно, что результаты можно получить на email, но это связано с очень медленным поиском;

UniProt: для меня показался наиболее удобным, поому что можно ввести ID, а не последовательность, которую предварительно надо найти и скачать, очень быстро работает и вообще красивый, интуитивынй интерфейс.

Сравнение со случайной последовательностью

На сайте, генерирующем рандомные последовталеьности, я получила последовательность из 500 символов. Первая аминокислота у нее была аспарагиновой кислотой и поиск в Blast не выдал ни одной находки. Я поменяла ее на метионин и, загрузив последовательность в Blast с критерием E-value=10, я получила всего две находки, у обоих был E-value 6.2. Такое высокое значение E-value говорит нам о том, что заданная последовательность довольно бессмысленная, но это было вплоне ожидаемо. Загрузим находки в Jalview.

Ссылка на выравнивание

Во-первых, я удалила у рандомной последовательности довольно большой участок гэпов. Во-вторых, по выравниванию видно, что у заданной последователньости с находками довольно низкий уровень идиентичности (всего 24 аминокислоты). Подводя итог, бессмысленная последовательность действительно оказалась бессмысленной :)