Основываясь на том, какие условия написаны в задании для выбора семейства доменов, я выбрала из таблицы для выбора семейство PF00998, в таблице оно было под номером 958.
Данное семейство включает вирусные РНК-зависимые ферменты РНК-полимеразы вируса гепатита С и различных вирусов растений.
РНК-зависимая РНК-полимераза также известна как неструктурный белок NS5B. NS5B - белок, похожий на другие вирусные РНК-полимеразы. Есть мнение, что репликация вируса гепатита С происходит в мембранно-связанных репликационных комплексах, которые транскрибируют положительную цепь, а полученная в результате отрицательная цепь используется в качестве матрицы для синтеза геномной РНК.
Основываясь на информации из Pfam, можно сделать вывод, что семейство доменов PF00998 встречается только у вирусов; при этом большая часть видов относится к непонятному царству. 5 штук относятся к Uncategorised virus, и лишь 74 вида подразделяются на известные таксономические категории. Видно, что данные 74 вида относятся к царству Orthotnavirae.
С Pfam был скачан файл seed. Все наблюдения осуществлялись при понижении порога identity в программе Jalview, и чем ниже был этот порог, тем больше появлялось окрашенных участков, что было предсказуемо.
Результат выравнивания при пороге идентичности в 100%
Результат выравнивания при пороге идентичности в 90%
Результат выравнивания при пороге идентичности в 70%
Результат выравнивания при пороге идентичности в 50%
Была создана таблица с полученной информацией по выраниванию seed.
По результатам выравнивания было обнаружено несколько гомологичных участков для всех последовательностей, поэтому исследуемые белки гомологичны друг другу на этих участках. Максимальный блок выравнивания для всех последовательностей имел длину в 21 аминокислоту.
Для построения карты локального сходства я выбрала 2 белка с разными доменными архитектурами (вся информация представлена в таблице).
Были скачаны файлы в формате FASTA с сайта InterPro:
При помощи сайта NCBI была построена карта локального сходства для этих последовательностей.
Исходя из полученного результата Dot Plot, можно сделать вывод, что данные последовательности гомологичны в связи с тем, что в их доменных архитектурах очень много одинаковых доменов, которые выравниваются. Дальнейший разрыв связан с тем, что во 2 доменной архитектуре есть домен HCV_NS5a_C, в то время как в 1 его нет.