Выравнивание и гомология

В работе было использовано выравнивание align_03.fasta. Конечный результат - jvp-проект со всеми окнами - можно скачать здесь.



Задание 1: Последовательность открыта в JalView, отсортирована по сходству методом построения древа Neighbour Joining Using BLOSUM62 и отображена в двух вариантах раскраски: BLOSUM62 с порогом консервативности 30 и ClustalX. Результат - на вкладках task_1.1 и task_1.2 проекта.


Рисунок 1: Множественное выравнивание с раскраской BLOSUM62

Рисунок 2: множественное выравнивание с раскраской ClustalX

Задание 2: В выравнивании можно выделить несколько участков, отвечающих определению вертикального блока. Они находятся на позициях 1-17, 30-38, 43-54, 95-105, 114-128, 134-140, 151-157. Высокая гомологичность позиций между блоками 2 и 3, а так же 5 и 6 позволяет объединить их в два кластера. Участок 62-66 можно отнести к понятию "блока" с некоторой натяжкой, поэтому он отмечен буквами "b". Блоки помечены в строке Layout буквой В, участки кластеров между блоками - С, участок с самым большим числом "гэпов" - буквой Х.


Рисунок 3: Блоки и кластеры


В результате сравнения последовательностей и анализа посторенного древа становится понятно, что наиболее близкими являются последовательности BUTPB и CELLD; Во вкладке task_02.d они объединены в одну группу и отмечены буквой Н на участке, по которому они похожи друг на друга и резко отличаются от других.

Рисунок 4: блок BUTPB и CELLD на участке Н

Задание 3: Посчитано для блока 1 (1-17):

  • Число абсолютно консервативных позиций: 10 (58.8%)
  • Число абсолютно функционально консервативных позиций: 14 (82.3%)
  • Консервативные на 70%: 11 (64.7%)
В самом длинном участке с гэпами (задание 2: 24-27) максимум 4 позиции с гэпами, что составляет 100% от ее длины.

Задание 4: В исходное выравнивание добавлена последовательность sequence_03.fasta с идентификатором SYNLT. Перевыровнено программой Muscle и раскрашено Clustalx. Сохранено во вкладке task_04.

Задание 5: В выравнивание добавлена заведомо негомологичная последовательность - первые 139 АК остатков последовательности белка L-rhamnose isomerase бактерии Bacteroides thetaiotaomicron (идентификатор Q8A1A2). После перевыравнивания программой Muscle можно наглядно в этом убедиться: только 9 колонок оказались абсолютно консервативны, еще несколько - функционально консервативными. Несмотря на то, что в выравнивании можно найти нечто похожее на блоки, любое их появление абсолютно случайно, а число гэпов заставляет забыть про кластеры.

Задание 6: Строим множественное "выравнивание" заведомо негомологичных белков, взятых у моих однокурсников:

Для этого импортируем их с помощью Fetch sequences, указав банк Uniprot и АС белков, а затем выравниваем программой Muscle. Как и ожидалось, в выравнивании не оказалось ни одного блока, отвечающего определению. Мне удалось выделить 2 участка с наибольшей концентраций функционально консервативных колонок, в первом "блоке" даже присутствует одна абсолютно консервативная колонка. Разумеется, появление этих "блоков" - чистая случайность.


Рисунок 5: первый "блок" с одной абсолютно консервативной колонкой

Рисунок 6: второй "блок"

"Выравнивание" сохранено в проекте на вкладке task_06



Назад к странице семестров

© Andrew Sigorskih,2015.