Практикум 12. BLAST

Задание 1.

Для поиска белковых последовательностей использовалась программа BLASTp на сайте NCBI. При первом запуске я изменила параметры Database, Max target sequences и Word size. Остальные параметры были выставлены по умолчанию. таблица Excel.

Описание параметров Blast

Построение множественного выравнивания

Среди находок я выбрала 7 белков. Это были 6 предположительно гомологичных белков с разными названиями и значениями E-value,с большим процентом покрытия(>90%) и предположительно негомологичный белок с большим значением E-value (9,3) и покрытием 16%. В программе Jalview было построено множественное выравнивание выбранных последовательностей (Рисунок 1). Затем я удалила одну из последовательностей(последннюю), участки выравнивания с которыми не свидетельствовали о гомологии. На Рисунке 2 - выравнивание всех гомологичных последовательностей.

Нетрудно заметить, что представленный участок с 432 по 443 аминокислоту представлен 12 колонками без гэпов, начинается и завершается абсолютно консервативной позицией и имеет высокую плотность консервативных позиций, что свидетельствует о гомологии выбранных последовательностей. Проект (jvp).

мнв
Рисунок 1. Участок множественного выравнивания в программе Jalview
всг
Рисунок 2. Участок выравнивания гомологичных белков в программе Jalview

Задание 2.

Из предложенных белков в файле было выбрано 2 белка из разных групп (идентификаторы E6SLJ6_THEM7; S8F0X9_FOMPI). Карта сходства (Dot Matrix) представлена на Рисунке 3. Можно заметить, что конец и начало гомологичны(и наоборот), значит была перестановка. Но при этом концы тоже гомологичны, что указывает на сложные дупликации.

картинка
Рисунок 3. Карта сходства двух белков. По оси OX - белок S8F0X9_FOMPI, по оси OY - белок E6SLJ6_THEM7

Игры с BLAST

Я взяла последовательность 'And if you gaze long into an abyss, the abyss also gazes into you' Со стандартными параметрами Blast не выдал ни одной находки. Тогда я поменяла параметр Max target sequences на 20000, параметр Expect threshold на 100, а параметр Word size на 2. BLAST нашел несколько последовательностей (10 штук), а наименьший E-value=23 с покрытием =56%, а прсоедовательность с наибольшим покрытием (88%) имеет E-value=75.

Теперь я провела поиск для с использованием последовательности белка FBP aldolase. С параметрами по умолчанию было найдено 30 последовательностей, минимальное значение E-value=0, максимальное =5,4(и единственное из значений, которое превысило единицу). Увеличив параметр Max target sequence до 20000, увеличилось число найденных последовательностей с 30 до 263, что логично, ведь мы просто изменили допустимое число последовательностей. Далее я изменила Word size на 6, и число последовательностей уменьшилось до 53, а максимальное значение E-value=98.

Оставив измененные ранее параметры, я решила поменять матрицу BLOSUM62 на BLOSUM90. Ничего не произошло, кроме уменьшения числа последовательностей на одну (самую последнюю), после чего максимальное значение E-value стало 97(тк 98 исключилось).