Гомология и множественное выравнивание.

1-2. Семейство Pfam для анализа:

Семейство вирусных РНК-зависимых РНК-полимераз.

АС(PF-номер): PF00998

ID: RdRP_3

Название: Viral RNA dependent RNA polymerase(вирусная РНК-зависимая РНК-полимераза)

Число последовательностей в seed: 32

Число последовательностей в full: 221

Число доменных архитектур: 14

Число видов: 208

3. Выравнивание seed.

Для построение выравнивания семейства было скачано выравнивание seed c Pfam и загржуен в Jalview. Выравнивание было раскрашено по Clustal и Above identity threshold, в последнем случае я меняла процент индетивности и получила следующие результаты: при 100% (абсолютно консерватинвные позиции это аминокисоты: аргинин, аспаргиновая кислота(4 колонки - больше всего), фенилаланин, глицин, аспаргин) - 10, при 95% - 16, при 80 - 33%.

Выравнивание seed.

После окрашивания по проценту идентиности были установлены максимальные достоверные блоки, включающие все последовательности: 344-345, 305-306, 341-343.

Для первых 18 последовательностей максимально достовреные блоки: 152-153, 164-165, 172-173, 240-245, 252-253, 305-306, 313-314, 342-343.

Участок, где нет достоверных подблоков(ход эволюции плохо отражён): 67-75, 196-201, 485-491.

Таким образом судить об общей гомологии белков можно так как есть несколько максимально достоверных блоков для всех последовательностей(хотя их мало, всего 10/544=0,018%). Но в целом есть много достоверных блоков для разных групп последовательностей, по ним можно суть о ходе эволюции.