Поиск по сходству. BLAST, E-value

Задание 1. Проверьте гомологичность белков, найденных поиском по сходству

ID/AC Название белка Coverage Identity % E-value гомологичность
ANI03399.1 nitrile hydratase subunit beta [Pseudomonas putida SJTE-1]      
P27763.1 Nitrile hydratase subunit beta[Pseudomonas chlororaphis subsp. Chlororaphis] 100% 87% 2E-143 да
P13449.1 Nitrile hydratase subunit beta[Rhodococcus erythropolis] 95% 58% 4E-85 да
Q7SID3.2 Cobalt-containing nitrile hydratase subunit beta[Pseudonocardia thermophila] 97% 28% 1E-15 да
A9V2C1.1 Probable nitrile hydratase[Monosiga brevicollis] 95% 28% 2E-10 да
O66187.3 Thiocyanate hydrolase subunit alpha[Thiobacillus thioparus] 45% 25% 0,056 нет
A5URD5.1 Nucleoside diphosphate kinase[ Roseiflexus sp. RS-1] 44% 25% 1,4 нет
Q56XP4.2 Sodium/hydrogen exchanger 2[Arabidopsis thaliana] 40% 30% 2,1 нет
C6D8W9.1 Aminomethyltransferase[Pectobacterium carotovorum subsp. carotovorum PC1] 31% 29% 5,7 нет
Q58DQ3.3 60S ribosomal protein L6[Bos taurus] 30% 28% 9,8 нет

Выводы о гомологичности последовательностей были сделаны по материалам, приведенным в таблице, описанию последовательностей на сайте ncbi и множественному выравниванию:

• Ссылка на проект Jalview

Фрагмент выравнивания всех десяти последовательностей:


Гомологичные последовательности выделены в отдельную группу:

Выравнивание пяти предположительно гомологичных последовательностей, блоки обозначены красными и бирюзовыми прямоугольниками (блоки, включающие остальные последовательности, выделить не удалось):

Задание 2. Опишите крупные перестройки между парой белков, имеющих гомологичные участки (домены)

Для второго задания были выбраны гомологичные последовательности из семейства Homeobox с различной доменной архитектурой.
Установленный порог E-value 1e-10, длина слова - 2.

Идентификатор Название
KFQ16150.1 Zinc fingers and homeoboxes protein 1 [Leptosomus discolor]
KFO30217.1 Zinc fingers and homeoboxes protein 3 [Fukomys damarensis]
Карта локального выравнивания:


Черными диагоналями обозначены участки гомологии:
B1~A1,
B2~A2,
B3~A3,
B5~A5,
B7~A4+A5+A6,
B8~A8,
B9~A10;
У KFO30217.1 произошла дупликация участка A5.
В местах разрывов диагонали произошла делеция участков последовательности.