Работа с программой PSI-BLAST

Поиск предков кристаллинов

Для выполнение данного практикума нами был выбран ипсилон-кристаллин утконоса (Ornithorhynchus anatinus), предположительно его предком является лактатдегидрогеназа А.
Первым этапом исследования было найти аминокслотную последовательность этого белка. Для этого обратились к базе NCBI Proteins.
Ссылка на найденную последовательность: AAP41494.1.
Далее, для того, чтобы проверить нашу гипотезу о предке белка, мы обратились к алгоритму PSI-BLAST, который проводил поиск по базе данных Swiss-prot.
При первом поиске предковых последовательностей при стандартных параметрах было найдено 500 находок (на деле это результат работы обычного blastp), так как по умолчанию blast выдает только первые 500 находок, можно сделать вывод, что в реальности, без ограничения, последовательностей нашлось бы еще больше.
Поэтому мы запустили PSI-BLAST заново, но с увеличением максимального числа находок до 1000. В результате получили 554 последовательностей с E-value < 0.005. Далее проводили повторные итерации, чтобы найти более дальних родственников. После второй итерации нашлось еще 181 последовательностей, после третьей - еще 25, четвертой - еще 33, пятой - еще 137, шестой - еще 70, и мы опять уперлись в верхнюю границу выдачи blast, 1000 последовательностей.
Находок оказалось очень много. Наиболее низкий E-value имели белки лактат- и малатдегидрогеназ различных организмов.
Находками с наибольшим весом оказались последовательности L-лактат-дегидрогеназы А различных обезъян, что мы и ожидали.
ID трех лучших находок из Swiss-prot: Q9BE24.4, Q5R5F0.3, Q5R1W9.3.


Рис. 1-3. Выравнивание лучших находок с искомой последовательностью.

В конечном итоге, мы нашли очень много последовательностей лактатдегидрогеназ из различных организмов, что подтверждает нашу гипотезу о том, что предком ипсилон-кристаллин является лактатдегидрогеназа А.