Учебный сайт Саши Якушевой

Второй семестр

Главная

Семестры

Обо мне

Ссылки

Поиск семейств гомологов, работа с PSI-BLAST

Скачать проект задания

Я выбрала последовательность с идентификатором Q1AHR3. Чтобы найти семейство гомологов использовался PSI-BLAST. Результаты его работы после 3 итераций представлены в таблице 1.

Таблица 1. Результаты итераций работы PSI-BLAST

Номер итерации Число находок выше порога (0,005) Идентификатор худшей находки выше порога E-value этой находки Идентификатор лучшей находки ниже порога E-value этой находки
1 39 XP_006764663.1 1e-04 WP_028385632.1 1.8
2 42 XP_004595223.1 0.001 XP_007525814.1 0.023
3 42 XP_006089598.1 2e-08 XP_007525814.1 0.011

Как видно из таблицы 1, после первого запуска отличие E-value лучшей находки ниже порога и худшей выше порога довольно сильно отличается. Но после второй итерации добавились еще 3 находки, а это различие уменьшилось. Для стабилизации я запустила еще одну итерацию. Новых белков не добавилось, но различие E-value увеличилось на 8 порядков. Дальнейшие итерации не нужны.

Таким образом семейство белка с идентификатором Q1AHR3 включает 42 последовательности. Скаченные последовательности в формате fasta можно скачать здесь.

PSI-BLAST, кроме всего прочего, нашел 2 последовательности, непохожие на другие, их можно расценить за ошибки, поэтому я удалила их из итогового выравнивания.

Найденные PSI-BLAST последовательности можно разделить на 2 подсемейства, которые легко различимы по длине последовательностей.

© Саша Якушева, 2014
sashayakusheva@fbb.msu.ru
Last modification date: 01.10.2014