Практикум 10

Поиск гомологов кинурениназы в Swiss-Prot

Рассматриваемый белок: Kynureninase (A0A2I2MA64_9FLAO) - катализирует реакцию расщепления L-кинуренина на антраниловую кислоту и аланин.

Параметры, использованные при запуске BLAST:
Банк: Swissprot
Максимальный размер выдачи: 100
Порог на E-value: 0.05
Длина слова: 5
Матрица аминокислотных замен: BLOSUM62
Штрафы за гэпы: 11 за существование и 1 за продолжение гэпа
Compositional adjustments: Conditional compositional score matrix adjustment
В качестве поискового запроса в BLAST я ввела последовательность кинурениназы.
Текстовая выдача BLAST
Выбранные 7 белков

Результаты множественного выравнивания

Вероятно, все 8 белков гомологичны, так как присутствует много консервативных участков, и нет белка, который бы сильно отличался от остальных.

Поиск гомологов зрелого вирусного белка, вырезанного из полипротеина в Swiss-Prot

Я выбрала белок с Annotation score: 5/5 и Protein existence: еvidence at protein level.
ID: GP_HTRV
AC: J3WAX0; J3SPZ8
OS: Heartland virus (HTRV)
Выбранная зрелая цепь: Glycoprotein N (координаты: 19-566)
Последовательность зрелого белка

Для поиска гомологов в BLAST были использованы те же параметры, что и в предыдущем задании.
Текстовая выдача BLAST

Всего нашлось 3 белка: R4V2Q5, A0A0B5A886, L7V0S7. Последний белок не является гомологичным GP_HTRV: вес выравнивания - 136, Query Cover – 65%, Percent Identity – 25.98%, также он резко отличается от других трех белков при просмотре выравнивания в программе Jalview. Поэтому в результате множественного выравнивания я оставила 3 белка, которые имеют много длинных консервативных участков.

Исследование зависимости E-value от объёма банка

После применения фильтра по организмам (Viruses) результаты поиска не изменились, так как все найденные в предыдущем задании белки принадлежали вирусам. E-value белка L7V0S7 поменялось с 1e-32 на 6e-34.
В формуле расчета E-value меняется только размер базы данных n, поэтому для оценки доли вирусных белков (доли длины вирусных белков от суммарной длины всех последовательностей) нужно разделить E-value при поиске, ограниченном вирусами на первое E-value: получилось 0.06 (6%).