Был проведен поиск гомологов последовательности в банке Uniprot/SwissProt с помощью программы protein blast (blasp). Процесс поиска представлен на рисунке 1, первый результат - исходный белок.

BLOSUM62

Рис. 1. Результаты работы Protein BLAST

Мною был выбран белок glycoside hydrolase организма Chitinophaga pinensis. Его характеристики, а также характеристики лучшей находки приведены ниже, в таблице 1.

Таблица 1. Характеристика выбранной мною находки и лучшей находки.

Description Max score Total score Query cover E value Ident Accession
glycoside hydrolase [Chitinophaga pinensis] 98.6 172 94% 7e-22 55% WP_012791286.1
Chain A, Crystal Structure Of A Betagamma-Crystallin Domain From Flavobacterium Johnsoniae [Flavobacterium johnsoniae UW101] 177 177 100% 3e-55 100% 3HZB_A

Мною была построена карта локального сходства моей последовательности и находки. Для этого использовалась функция BLAST - "align two or more sequences". Карта локального сходства представлена на рис.2

Hit_matrix

Рис. 2. Карта локального сходства

Из карты локального сходства можно предположить, что в glycoside hydrolase cодержится три участка, комплементарных практически всему моему белку, при этом интересно, что эти участки перекрываются между собой. Возможно мы видим результат двух дупликаций изначально одиночного участка.

Далее мною было проверено, какая часть находок принадлежит эукариотам. Выдача BLAST представлена на рис.3. Находок с e-value ≤ 0.001 оказалаось всего три.

blast_eukariote

Рис. 3. Выдача BLAST с фильтром по эукариотам.

После этого мною были скачены последовательности находок с E-value ≤ 0.00001 и длиной, близкой к длине последовательности моего белка и произведено множественное выравнивание. Скачать файл в формате .fasta можно по этой ссылке. Процент функционально консервативных и консервативных колонок – 0%