Анализ множественного выравнивания из предыдущего задания с помощью JalView

Из выравнивания, построенного в предыдущем задании, я выделила три вертикальных блока, в пределах которых можно ожидать гомологию аминокислотных остатков из разных последовательностей. Ниже представлено изображение данного выравнивания с блоками, помеченными буквой "B". Скачать выравнивание в формате FASTA.

Можно обратить внимание, что если убрать из перечня предпоследнюю последовательность (идентификатор Q38WL4_LACSS), то станет возможным выделить ещё один блок. Из чего можно сделать вывод, что остальные четыре последовательности, объединённые в группу на рисунке ниже, более родственны друг другу. Новый блок обозначен буквой "H".

Мы видим, что в процессе эволюции в блоке "H" у последовательности №4 появились такие мутации, как замена ароматичных фенилаланина и гомологичного ему гидрофильного тирозина на аминокислоту серин с сохранением гидрофильности и потерей ароматичности. В соседней справа колонке, мы видим, что у отличающейся последовательности функционально гомологичные треонин и серин, содержащие гидрофильную ОН-группу, заменены на аспарагин тоже с гидрофильной амидной группой -СО(NH2). Также в последнем столбце блока в группе очевидна гомология между остатками валина и изолейцина, которую легко можно объяснить присоединением группы -CH3 к одной из метильных групп валина для образования изолейцина. А, как известно, переносы групп -CH3 часто встречаются в природе.

Подсчёт числа и процента абсолютно консервативных позиций и абсолютно функционально консервативных

Рассмотрим первый "В" блок.
Число позиций = 23.
Число абсолютно консервативных позиций = 4.
Процент абсолютно консервативных позиций = 17.4%.
Число абсолютно функционально консервативных позиций = 10.
Процент абсолютно функционально консервативных позиций = 43.5%.

Подсчёт числа и процента позиций с гэпами для участка "X"


Число позиций = 11.
Число позиций с гэпами = 4.
Процент позиций с гэпами = 36.4%.

Чтобы скачать весь проект, нажмите на ссылку.

Консенсусная последовательность и LOGO

Консенсусная последовательность выравнивания - скачать.
Последовательность LOGO, построенная для всего выравнивания по данным консенсусной последовательности:

Консенсусная последовательность первого "B" блока - скачать.
Последовательность LOGO, построенная для данного блока по данным консенсусной последовательности:

Построение паттерна для первого блока "В"

[VI]-G-[IL]-[TS]-[DER]-[YFA]-[AG]-x(3)-[LF]-G-[DEL]-[VI]-x(2)-[VL]-[ED]-[LVM]-P-x-[AE]-G

Поиск совпадений заведомо негомологичной последовательности с исследуемым множественным выравниванием

Для сравнения возьмём первые 110 аминокислотных остатков из пептидогликан гликозилтрансферазы. Скачать участок белка в FASTA формате. Скачать всю последовательность белка в FASTA формате. Ниже представлено изображение получившегося выравнивания. Красным пунктиром выделен новый участок последовательности.

Число совпадений нового участка последовательности с абсолютно консервативными позициями в блоках = 4.
Процент таких совпадений от общего числа абсолютно консервативных позиций в блоках (11) = 36.4%.
Число совпадений нового участка последовательности с абсолютно функционально консервативными позициями в блоках = 10.
Процент таких совпадений от общего числа абсолютно функционально консервативных позиций в блоках (23) = 43.5%.

Чтобы скачать весь проект, нажмите на ссылку.

Построение множественного "выравнивания" заведомо негомологичных (не родственных) белков и его исследование

Из базы данных Uniprot я скачала последовательности семи негомологичных белков, краткая информация о которых представлена в таблице 1.

Таблица 1. Информация о белковых последовательностях
Идентификатор Организм Длина последовательности в аминокислотных остатках Белок и функция
PHRA_AGRFC Agrobacterium fabrum 479 Деоксирибодипиримидин фото-лиаза
A8IKD2_AZOC5 Azorhizobium caulinodans 356 Аминогидролаза циануровой кислоты
A3DJ38_CLOTH Clostridium thermocellum 870 Металлофосфоэстераза
Q8RG11_FUSNN Fusobacterium nucleatum subsp. nucleatum 335 D-лактат дегидрогеназа
Q74BH2_GEOSL Geobacter sulfurreducens 210 HAD надсемейство гидролазы
Q9JYV4_NEIMB Neisseria meningitidis serogroup B 867 Аминопептидаза N
Q8AAN6_BACTN Bacteroides thetaiotaomicron 435 Лигаза фенилацетат-коэнзима А

У последовательностей №3 и №6 для исследования возьмём участки длиной в 480 аминокислотных остатков. Скачать последовательности, используемые в исследовании, в формате FASTA. В результате мне удалось найти три псевдоблока, представленных на изображении ниже.

Мы видим, что такое выравнивание содержит много гэпов. Хоть в нём и можно найти некоторые совпадения в колонках и даже выделить "блоки", но таких участков настолько мало, что нельзя говорить о гомологии аминокислотных остатков и белковых последовательностей. Все совпадения имеют случайный характер. Таким образом, если при построении выравнивания удаётся обнаружить достаточное количество консервативных колонок, между которыми минимальное количество гэпов, то можно утверждать о гомологии белковых последовательностей и исслеловать гомологию аминокислотных остатков.
Скачать выравнивание в FASTA формате.

Чтобы скачать этот проект, нажмите на ссылку.