Описание параметров Blast
Построение множественного выравнивания
Среди находок я выбрала 7 белков. Это были 6 предположительно гомологичных белков с разными названиями и значениями E-value,с большим процентом покрытия(>90%) и предположительно негомологичный белок с большим значением E-value (9,3) и покрытием 16%. В программе Jalview было построено множественное выравнивание выбранных последовательностей (Рисунок 1). Затем я удалила одну из последовательностей(последннюю), участки выравнивания с которыми не свидетельствовали о гомологии. На Рисунке 2 - выравнивание всех гомологичных последовательностей.
Нетрудно заметить, что представленный участок с 432 по 443 аминокислоту представлен 12 колонками без гэпов, начинается и завершается абсолютно консервативной позицией и имеет высокую плотность консервативных позиций, что свидетельствует о гомологии выбранных последовательностей. Проект (jvp).
Из предложенных белков в файле было выбрано 2 белка из разных групп (идентификаторы E6SLJ6_THEM7; S8F0X9_FOMPI). Карта сходства (Dot Matrix) представлена на Рисунке 3. Можно заметить, что конец и начало гомологичны(и наоборот), значит была перестановка. Но при этом концы тоже гомологичны, что указывает на сложные дупликации.
Я взяла последовательность 'And if you gaze long into an abyss, the abyss also gazes into you' Со стандартными параметрами Blast не выдал ни одной находки. Тогда я поменяла параметр Max target sequences на 20000, параметр Expect threshold на 100, а параметр Word size на 2. BLAST нашел несколько последовательностей (10 штук), а наименьший E-value=23 с покрытием =56%, а прсоедовательность с наибольшим покрытием (88%) имеет E-value=75.
Теперь я провела поиск для с использованием последовательности белка FBP aldolase. С параметрами по умолчанию было найдено 30 последовательностей, минимальное значение E-value=0, максимальное =5,4(и единственное из значений, которое превысило единицу). Увеличив параметр Max target sequence до 20000, увеличилось число найденных последовательностей с 30 до 263, что логично, ведь мы просто изменили допустимое число последовательностей. Далее я изменила Word size на 6, и число последовательностей уменьшилось до 53, а максимальное значение E-value=98.
Оставив измененные ранее параметры, я решила поменять матрицу BLOSUM62 на BLOSUM90. Ничего не произошло, кроме уменьшения числа последовательностей на одну (самую последнюю), после чего максимальное значение E-value стало 97(тк 98 исключилось).