Практикум 11. Гомология и выравнивания

Выбор семейства доменов из Pfam для анализа

Основываясь на том, какие условия написаны в задании для выбора семейства доменов, я выбрала из таблицы для выбора семейство PF00998, в таблице оно было под номером 958.

Краткое описание семейства

Данное семейство включает вирусные РНК-зависимые ферменты РНК-полимеразы вируса гепатита С и различных вирусов растений.

РНК-зависимая РНК-полимераза также известна как неструктурный белок NS5B. NS5B - белок, похожий на другие вирусные РНК-полимеразы. Есть мнение, что репликация вируса гепатита С происходит в мембранно-связанных репликационных комплексах, которые транскрибируют положительную цепь, а полученная в результате отрицательная цепь используется в качестве матрицы для синтеза геномной РНК.

Основываясь на информации из Pfam, можно сделать вывод, что семейство доменов PF00998 встречается только у вирусов; при этом большая часть видов относится к непонятному царству. 5 штук относятся к Uncategorised virus, и лишь 74 вида подразделяются на известные таксономические категории. Видно, что данные 74 вида относятся к царству Orthotnavirae.

Описание выравнивания seed с точки зрения гомологичности всех последовательностей или их подмножества

С Pfam был скачан файл seed. Все наблюдения осуществлялись при понижении порога identity в программе Jalview, и чем ниже был этот порог, тем больше появлялось окрашенных участков, что было предсказуемо.

Результат выравнивания при пороге идентичности в 100%

Рисунок 1. Результат поиска при 100% identity

Результат выравнивания при пороге идентичности в 90%

Рисунок 2. Результат поиска при 90% identity

Результат выравнивания при пороге идентичности в 70%

Рисунок 3. Результат поиска при 70% identity

Результат выравнивания при пороге идентичности в 50%

Рисунок 4. Результат поиска при 50% identity

Была создана таблица с полученной информацией по выраниванию seed.

Рисунок 5. Таблица с информацией по выравниванию seed

По результатам выравнивания было обнаружено несколько гомологичных участков для всех последовательностей, поэтому исследуемые белки гомологичны друг другу на этих участках. Максимальный блок выравнивания для всех последовательностей имел длину в 21 аминокислоту.

Построение карты локального сходства (dotplot) двух последовательностей с одним и тем же доменом, но с разной доменной архитектурой

Для построения карты локального сходства я выбрала 2 белка с разными доменными архитектурами (вся информация представлена в таблице).

Рисунок 6. Выбранные доменные архитектуры
Рисунок 7. Таблица с информацией для dotplot

Были скачаны файлы в формате FASTA с сайта InterPro:

При помощи сайта NCBI была построена карта локального сходства для этих последовательностей.

Рисунок 8. Карта локального сходства

Исходя из полученного результата Dot Plot, можно сделать вывод, что данные последовательности гомологичны в связи с тем, что в их доменных архитектурах очень много одинаковых доменов, которые выравниваются. Дальнейший разрыв связан с тем, что во 2 доменной архитектуре есть домен HCV_NS5a_C, в то время как в 1 его нет.