1-2. Семейство Pfam для анализа:
Семейство вирусных РНК-зависимых РНК-полимераз.
АС(PF-номер): PF00998
ID: RdRP_3
Название: Viral RNA dependent RNA polymerase(вирусная РНК-зависимая РНК-полимераза)
Число последовательностей в seed: 32
Число последовательностей в full: 221
Число доменных архитектур: 14
Число видов: 208
3. Выравнивание seed.
Для построение выравнивания семейства было скачано выравнивание seed c Pfam и загржуен в Jalview. Выравнивание было раскрашено по Clustal и Above identity threshold, в последнем случае я меняла процент индетивности и получила следующие результаты: при 100% (абсолютно консерватинвные позиции это аминокисоты: аргинин, аспаргиновая кислота(4 колонки - больше всего), фенилаланин, глицин, аспаргин) - 10, при 95% - 16, при 80 - 33%.
После окрашивания по проценту идентиности были установлены максимальные достоверные блоки, включающие все последовательности: 344-345, 305-306, 341-343.
Для первых 18 последовательностей максимально достовреные блоки: 152-153, 164-165, 172-173, 240-245, 252-253, 305-306, 313-314, 342-343.
Участок, где нет достоверных подблоков(ход эволюции плохо отражён): 67-75, 196-201, 485-491.
Таким образом судить об общей гомологии белков можно так как есть несколько максимально достоверных блоков для всех последовательностей(хотя их мало, всего 10/544=0,018%). Но в целом есть много достоверных блоков для разных групп последовательностей, по ним можно суть о ходе эволюции.