BLAST

Поиск гомологичных белков в SwissProt с помощью BLAST

Параметры BLAST:
Query subrange – диапазон последовательности, по которому ведётся поиск
Database – в какой базе данных искать гомологи
Organism – выбрать организмы, только среди которых будет проводиться поиск
Exclude – можно исключить некоторые опции из поиска
Algorithm – какой алгоритм будет использоваться при поиске
Max target sequences – максимальное количество последовательностей, которые будут выданы после поиска
Short queries – при выборе автоматически редактирует параметры, например word size, для коротких последовательностей (для улучшения поиска)
Expect threshold – максимальное e-value найденных последовательностей
Word size – длина слова
Max matches in a query range – ограничивает число находок BLAST в одной последовательности из банка (0 - без ограничений)
Matrix – какую матрицу использовать при подсчёте веса
Gap Costs – штрафы за открытие инделя и за каждый последующий гэп
Compositional adjustments – борьба с участками малой сложности

С помощью сайта NCBI были выполнены задания по поиску гомологов белков, для этого я воспользовалась разновидностью программы BLAST BLASTp. Ниже приведена таблица (Table 1)с найденными гомологичными последовательностями.

  • Table 1
  • Было построено множественное выравнивание этих последовательностей. Из полученного выравнивания можно сделать вывод о том, что рассмотренные белки гомологичны, т.к. в выравнивании имеется 2 участка, начинающихся и заканчивающихся абсолютно консервативной позицией, с длинной более 6 а.о., без колонок с гэпами и с высокой плотностью консервативных позиций.

    Oops

    Карты сходства белков

    Для построения карты локального сходства я выбрала белок E4ZIZ7_LEPMJ и белок S8FKT8_FOMPI. Данные белки не являются гомологичными, что подтверждает относительно небольшой процент покрытия (47%), однако имеют удивительно много гомологичных участков.

    Oops

    Игры с BLAST

    Я взяла последовательность, явно не являющуюся белковой: 'tigertigerburningbright'
    После я провела пару разных запросов в BLAST:

    1) С изменением Max target sequences на 20000.
    Результат: 20000 гомологичных последовательностей. Такое большое число находок получилось благодаря Short queries, который автоматически редактирует параметры для коротких последовательностей для более эффективного поиска.

    2) Word size: 2; Expect threshold: 1000; short queries off
    Результат: 24 последовательности. Такое число находок объясняется очень большим допустимым значением e-value, а также маленьким значением word size.