Практикум 10

PSI-BLAST

Я выбрала случайный белок из данного списка, а именно P39450. Это белок Photobacterium damselae subsp. piscicida – патогенной для рыб грам-отрицательной бактерии.

Рекомедуемое название белка: S-(hydroxymethyl) glutathione dehydrogenase.

Этот белок участвует в метаболизме формальдегида по схеме, приведённой на рисунке, окисляет S-(гидроксиметил)глутатион.

Рис. 1 Схема метаболизма формальдегида. Картинка сделана не для данного белка, но общая схема метаболизма, насколько я поняла, та же.

Для этого белка запустила 5 итераций PSI-BLAST по базе данных swissprot, увеличив максимально возможное колчество находимых последовательнсотей до 5000. Кроме того, из-за большого числа находок я решила уменьшить порог для тех белков, которые участвуют в перестройке PSSM до 5e-4, а общий порог до 0.005. На третьей итерации я подумала, что происходит выход на плато, но потом оказалось, что нет, и дальше я решила не делать, потому что BLAST уже заметно подвисал. Не знаю, что я сделала не так, возможно, нужно было как-то иначе поменять пороги.

Таблица 1 Выдача после первых пяти итераций
Номер итерации Число находок выше порога (0,005) Идентификатор худшей находки выше порога E-value этой находки Идентификатор лучшей находки ниже порога E-value этой находки
1 456 A0A0E4FKF7.1 4,00E-04 Q29318.2 5,00E-04
2 812 P55100.2 4,00E-04 Q9DBM2.4 7,00E-04
3 869 Q9K8F8.1 5,00E-04 Q6LLY5.2 6,00E-04
4 1057 A6V2Q4.1 5,00E-04 A5EVX5.1 5,00E-04
5 1559 P44074.1 5,00E-04 Q9RXR2.1 5,00E-04