Практикум 11

или "да что такое этот ваш seed?"

Гомология и выравнивание

1. Выбор и описание семейства доменов

Для выполнения задания я выбрала семейство под номером 958 из предложенного списка. Этим семейством стало семейство доменов PF00998.

Описание семейства:

AC: PF00998

ID: RdRP_3

Name: Viral RNA dependent RNA polymerase

Seed: 32

Full: 221

Structures: 413

Species: 208

Number of domain architectures: 14

Краткое описание из Pfam: данное семейство включает вирусные РНК-зависимые ферменты РНК-полимеразы вируса гепатита С и различных вирусов растений.

Краткое описание РНК-зависимой РНК-полимеразы: РНК-зависимая РНК-полимераза также известна как неструктурный белок NS5B. NS5B - это белок, который напоминает другие вирусные РНК-полимеразы. Считается, что репликация вируса гепатита С происходит в мембранно-связанных репликационных комплексах. Эти комплексы транскрибируют положительную цепь, и полученная в результате отрицательная цепь используется в качестве матрицы для синтеза геномной РНК. В реакции участвуют два вирусных белка: NS3 и NS5B, соответственно. Ссылка на источник

Таблица 1. Краткое описание выбранного семейства доменов

2. Таксономическая распространенность

Исходя из информации в Pfam, можно увидеть, что семейство доменов PF00998 встречается только у вирусов. Причем, бОльшая часть видов, а именно 130, относится к неизвестному царству. Еще 5 относятся к "Uncategorised virus", и лишь 74 вида подразделяются на известные таксономические категории. В данном случае, данные 74 вида относятся к царству орторнавирусов (Orthotnavirae).

Рис.2. Таксономическая распространенность, разделение по видам

Филогенетическое дерево семейства по выравниванию seed:

Рис.3. Филогенетическое дерево

3. Описание выравнивания seed с точки зрения гомологичности всех последовательностей или их подмножества

Все наблюдения осуществлялись при понижении порога identity, и чем ниже был этот порог, тем больше появлялось окрашенных участков. Что, впрочем, неудивительно:)

Ссылка на проект выравнивания seed Jalview, порог identity 100%

Ссылка на проект выравнивания seed Jalview, порог identity 90%

Ссылка на проект выравнивания seed Jalview, порог identity 70%

Ссылка на проект выравнивания seed Jalview, порог identity 50%

Рис.4. Выравнивание seed, порог identity 100%

Рис.5. Выравнивание seed, порог identity 90%

Рис.6. Выравнивание seed, порог identity 70%

Рис.7. Выравнивание seed, порог identity 50%

По полученным данным можно сделать следующие выводы:

1) Максимально достоверными блоками, которые есть во всех последовательностях оказались блоки 48, 240, 244-245, 303, 306, 314, 341-343, 392. Т.е. всего блоков, которые содержат все последовательности оказалось 11.

2)Блоки 159, 176, 189, 277, 305, 310 также являются достоверными, 31 из 32 последовательностей содержат их.

3)Перечисленные выше блоки наверняка отражают ход эволюции. Особенно это касается блоков 244-245 и 341-343.