Практикум 10
Поиск гомологов кинурениназы в Swiss-Prot
Рассматриваемый белок: Kynureninase (A0A2I2MA64_9FLAO) - катализирует реакцию расщепления L-кинуренина на антраниловую кислоту и аланин.
Параметры, использованные при запуске BLAST: Банк: Swissprot Максимальный размер выдачи: 100 Порог на E-value: 0.05 Длина слова: 5 Матрица аминокислотных замен: BLOSUM62 Штрафы за гэпы: 11 за существование и 1 за продолжение гэпа Compositional adjustments: Conditional compositional score matrix adjustment В качестве поискового запроса в BLAST я ввела последовательность кинурениназы. Текстовая выдача BLAST Выбранные 7 белков
Результаты множественного выравнивания
Вероятно, все 8 белков гомологичны, так как присутствует много консервативных участков, и нет белка, который бы сильно отличался от остальных.
Поиск гомологов зрелого вирусного белка, вырезанного из полипротеина в Swiss-Prot
Я выбрала белок с Annotation score: 5/5 и Protein existence: еvidence at protein level. ID: GP_HTRV AC: J3WAX0; J3SPZ8 OS: Heartland virus (HTRV) Выбранная зрелая цепь: Glycoprotein N (координаты: 19-566) Последовательность зрелого белка
Для поиска гомологов в BLAST были использованы те же параметры, что и в предыдущем задании. Текстовая выдача BLAST
Всего нашлось 3 белка: R4V2Q5, A0A0B5A886, L7V0S7. Последний белок не является гомологичным GP_HTRV: вес выравнивания - 136, Query Cover – 65%, Percent Identity – 25.98%, также он резко отличается от других трех белков при просмотре выравнивания в программе Jalview. Поэтому в результате множественного выравнивания я оставила 3 белка, которые имеют много длинных консервативных участков.
Исследование зависимости E-value от объёма банка
После применения фильтра по организмам (Viruses) результаты поиска не изменились, так как все найденные в предыдущем задании белки принадлежали вирусам. E-value белка L7V0S7 поменялось с 1e-32 на 6e-34. В формуле расчета E-value меняется только размер базы данных n, поэтому для оценки доли вирусных белков (доли длины вирусных белков от суммарной длины всех последовательностей) нужно разделить E-value при поиске, ограниченном вирусами на первое E-value: получилось 0.06 (6%).