BLAST


Задание 1

Для выполнения задания я взял белок P00947 (SDIS_COMTE). Я искал в в американском аналоге Uniprot - в Refseq proteins, потому что в Uniprot не было нужно мне количества последовательностей.

Ccылка на варвнивание.
ID/AC Название белка Ident, % Coverage, % E-value Гомологичность
WP_003078309.1 Steroid Delta-isomerase 100.000 100.00 8.08e-86 +
WP_034396811.1 Steroid Delta-isomerase 96.748 98.37 5.20e-82 +
WP_034360297.1 Steroid Delta-isomerase 96.748 98.37 1.22e-81 +
WP_034375646.1 Steroid Delta-isomerase 95.968 98.39 1.56e-81 +
WP_034378486.1 Steroid Delta-isomerase 95.935 97.56 2.22e-81 +
WP_043079434.1 Steroid Delta-isomerase 45.378 60.50 3.33e-23 +
WP_074354082.1 Steroid Delta-isomerase 45.378 59.66 5.93e-23 -
WP_005059319.1 Steroid Delta-isomerase 45.378 59.66 6.20e-23 -
WP_067475980.1 Steroid Delta-isomerase 39.167 60.00 4.14e-22 +
WP_017795330.1 Steroid Delta-isomerase 37.903 60.48 1.18e-22 -
Таблица 1.
Рисунок 1. Выравнивание

Коментарии:

Для определения гомологичности я опирался на выравнивания, полученные в JalView и BLAST.
Я решил, что WP_074354082.1, WP_005059319.1 и WP_017795330.1 не гомологичны исходному белку, потому что процент Ident, Coverage, и значение E-value достаточно низок. Так же мы отчетливо видим, что у этих трех белков не достаточное число консервативных остатков из консервативных колонок.

Задание 2

Для выполнения этого здания я воспользовался базой данных о семействах доменов «Pfam».
Я выбрал белки из семейство «LIM»: Query_231675 и Query_231677.


Рисунок 2. Выравнивание

Коментарии:

На рисунке 2 изображено локальное выранивание последовательностей. На оси абсцисс – последовательность Query_76192, а по оси ординат - Query_76195.
В круг выделена область делеция – потеря участка последовательности.
Синим отмечена дупликация участка.


© Угольков Ярослав, 2017