Из предложенных белков был случайным образом выбран белок Q3SXS7, принадлежащий мыши. Был проведен поиск по банку данных Refseq proteins. В таблице 1 приведены результаты 7 последовательных итераций. На 7-ой результат стабилизировался и список находок совпал с данными, поданными на вход.
Номер итерации | Число находок выше порога (0,005) | Идентификатор худшей находки выше порога | E-value этой находки | Идентификатор лучшей находки ниже порога | E-value этой находки |
1 | 30 | XP_003905673.1 | 6e-05 | XP_004481317.1 | 0.010 |
2 | 35 | XP_003362758.1 | 2e-04 | XP_004613487.1 | 0.012 |
3 | 66 | XP_608246.4 | 1e-04 | XP_004454535.1 | 0.013 |
4 | 67 | XP_608246.4 | 9e-10 | XP_003586004.1 | 0.047 |
5 | 66 | XP_004484190.1 | 2e-09 | XP_004323564.1 | 0.059 |
6 | 67 | XP_004484190.1 | 9e-11 | WP_006516186.1 | 0.022 |
7 | 67 | XP_004484190.1 | 5e-11 | XP_004323564.1 | 0.031 |
Таблица 1. Результаты поиска гипотетических гомологов белка YPJD_BACSU.
При получении результатов не было обнаружено ни одной выделяющейся последовательность, хотя во второй и третьей итерациях можно наблюдать очень небольшие различия между E-value худшей из подходящих находок и лучшей из неподходящих. Значения всегда плавно стремились к значению последнего E-value, поэтомы выборки не нуждались в редактировании. Порог E-value был задан по умолчанию 0.005. На рисунке 1 изображено построенное по последнему поиску множественное выравнивание гомологов (ссылка на файл в формате jar).
Рисунок 1. Множественное выравнивание найденных гомологов. Использовалась разработанная мной ранее цветовая схема, в которой разные цвета соответствуют аминокислотным остаткам, принадлежащим разным группам: алифатические, полярные и т.д.
Получившееся выравнивание нельзя четко разделить на блоки, однако видны участки с явно большой консервативностью.
Источники: