Понятие о выравнивании

Текстовое описание:

В работе изучается выравнивание последовательностей, визуализируемое с помощью JalView.

    Файлы с проектами в JalView:
  • выравнивание для align_13.fasta и sequence_13.fasta: pr8_t1-5.jvp
  • выравнивание случайных последовательностей: randByMuscle.jvp

1. Использован набор последовательностей align_13.fasta.

  • раскраска BLOSUM62 с порогом консервативности 30:
  • раскраска ClustalX:
  • Древо гомологов:

2. Участки с ожидаемой гомологией:

а) при разбиении на вертикальные блоки их получилось 5: 13-27; 47-153; 163-191; 196-202; 210-233.
b) Блоки в кластеры объединить нельзя: нет промежутка между блоками, не содержащего гэпы ни в одной колонке, а те, которые содержатся, длиной не равны длине промежутка.
c) Участок с 28 по 46 АК-остаток - самый длинный из промежутков между блоками.
Результат пунктов а), б) и с):

d) Если сравнить меж собой последовательности BUTPB/1-238 и ROSHA/1-237, то окажется, что все, даже самый длинный из выделенных во множественном выравнивании, промежутки, образуют блоки. Следовательно, выровненные попарно, эти последовательности образуют единый блок и являются гомологичными на 100%. Другие последовательности в подобном сходстве замечены не были.
Демонстрация гомологичности:

3. Для статистики выбран блок 13-27 из 15 позиций, среди которых:
Абсолютно консервативных: 6 (40%)
Абсолютно функционально консервативных: 9 (60%)
Консервативных на 70%: 10 (66,67%)
Функционально консервативных на 70%: 10 (66,67%)
в самом длинном промежутке (с 28 по 46 АК-остаток) 3 колонки, содержащие хотя бы один гэп. Доля гэпов составляет 3/19 = 15,79%
4. В качестве добавочной последовательности взята sequence_13.fasta. Для сравнения невыровненной и выровненной последовательности sequence_13 добавлена дважды, невыровнена нижняя.

После выравнивания видно, что последовательность обладает схожей степенью гомологичности со всеми предыдущими.

5. В качестве заведомо негомологичной последовательности взят участок белка из работы первого семестра. При раскраске ClustalX очевидно, что теперь в выравнивании нельзя выделить ни единого блока:

Однако можо найти 13 абсолютно и консервативных позиций.

6. Для выравнивания были ипользованы последовательности, сгенерированные с помощью сервиса http://web.expasy.org/randseq/. На 5 последовательностях длиной 120 АК, выровненных с помощью MUSCLE с настройками по умолчанию, невозможно выделить ни единого блока и нет ни одной абсолютно консервативной позиции, только 6 функционально-консервативных:
.