|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Поиск гомологов в PSI-BLAST – инструмент для поиска гомологичных белков, как и pBLAST с тем отличием, что просто BLAST всегда использует зарнее
заготовленную матрицу весов замен аминокислот, когда PSI-BLAST после проведения первого поиска по той же матрице составляет новую, уникальную для данного
белка, которая учитывает не только встречаемость аминокислот, но и их порядок. Для второго и последующих поиска можно модифицировать эту новую матрицу,
выбирая белки, по которым она будет строиться. Работа этой машины была рассмотрена на примере белка Q9NXZ6. В табл.1 приведены данные по поиску при помощи PSI-BLAST. Несмотря на то, что алгоритм, кажется, должен находить спустя несколько циклов некоторое количество пропущенных BLAST белков, это не так. Во-первых, при пользовании этой машиной необходимо тщательно проверять, по каким именно белкам будет составляться матрица, иначе с каждым новым поиском количество не имеющих к данному белку будет становиться только больше (см.фиг.1). При отборе белков я выбрасывал последовательности с более чем 340 АО. Однако, как показало последующее выравнивание (см.фиг.2), ряд белков длиной в 212-230 и 330-340, а также один белок длиной 263 (NP_001158365.1), тоже были лишними. В результате, все оставшиеся белки имеют очень высокую идентичность (см.фиг.3), что, возможно, является естественным. Но суть в том, что не было обнаружено никаких новых белков, которых бы не обнаружил обычный BLAST. |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
![]() ![]() фиг.1 – некоторые результаты BLAST, которые помешают дальнейшему поиску гомологов |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
![]() фиг.2 – изначальное выравнивание с яано лишними последовательностями |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
![]() фиг.3 – то же выравнивание, что и на фиг.2, но лишние последовательности убраны |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Не был обнаружен сам белок Q9NXZ6_HUMAN, поэтому помимо поиска в RefSeq я провёл и поиск в nr. При поиске я уже был более избирателен. Также я убрал половину
белков с идентичностью более 90%, чтобы матрица не была слишком строгой. Но даже эти меры не помогли найти новые последовательности. По-прежнему все
обнаруженные белки практически полностью идентичны и так же имеются явно сторонние последовательности (см.фиг.4). Cамо выравнивание |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
![]() фиг.4 – выравнивание, составленное по поиску гомологов белка Q9NXZ6_HUMAN в БД nr |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Табл.1 – нек-рые результаты при помощи PSI-BLAST |