Анализ множественного выравнивания из предыдущего задания с помощью JalView
Из выравнивания, построенного в предыдущем задании, я выделила три вертикальных блока, в пределах которых можно ожидать гомологию аминокислотных остатков из разных последовательностей. Ниже представлено изображение данного выравнивания с блоками, помеченными буквой "B". Скачать выравнивание в формате FASTA.
Можно обратить внимание, что если убрать из перечня предпоследнюю последовательность (идентификатор Q38WL4_LACSS), то станет возможным выделить ещё один блок. Из чего можно сделать вывод, что остальные четыре последовательности, объединённые в группу на рисунке ниже, более родственны друг другу. Новый блок обозначен буквой "H".
Мы видим, что в процессе эволюции в блоке "H" у последовательности №4 появились такие мутации, как замена ароматичных фенилаланина и гомологичного ему гидрофильного тирозина на аминокислоту серин с сохранением гидрофильности и потерей ароматичности. В соседней справа колонке, мы видим, что у отличающейся последовательности функционально гомологичные треонин и серин, содержащие гидрофильную ОН-группу, заменены на аспарагин тоже с гидрофильной амидной группой -СО(NH2). Также в последнем столбце блока в группе очевидна гомология между остатками валина и изолейцина, которую легко можно объяснить присоединением группы -CH3 к одной из метильных групп валина для образования изолейцина. А, как известно, переносы групп -CH3 часто встречаются в природе.
Подсчёт числа и процента абсолютно консервативных позиций и абсолютно функционально консервативных
Рассмотрим первый "В" блок.
Число позиций = 23.
Число абсолютно консервативных позиций = 4.
Процент абсолютно консервативных позиций = 17.4%.
Число абсолютно функционально консервативных позиций = 10.
Процент абсолютно функционально консервативных позиций = 43.5%.
Подсчёт числа и процента позиций с гэпами для участка "X"
Число позиций = 11.
Число позиций с гэпами = 4.
Процент позиций с гэпами = 36.4%.
Чтобы скачать весь проект, нажмите на ссылку.
Консенсусная последовательность и LOGO
Консенсусная последовательность выравнивания - скачать.
Последовательность LOGO, построенная для всего выравнивания по данным консенсусной последовательности:
Консенсусная последовательность первого "B" блока - скачать.
Последовательность LOGO, построенная для данного блока по данным консенсусной последовательности:
Построение паттерна для первого блока "В"
[VI]-G-[IL]-[TS]-[DER]-[YFA]-[AG]-x(3)-[LF]-G-[DEL]-[VI]-x(2)-[VL]-[ED]-[LVM]-P-x-[AE]-G
Поиск совпадений заведомо негомологичной последовательности с исследуемым множественным выравниванием
Для сравнения возьмём первые 110 аминокислотных остатков из пептидогликан гликозилтрансферазы. Скачать участок белка в FASTA формате. Скачать всю последовательность белка в FASTA формате. Ниже представлено изображение получившегося выравнивания. Красным пунктиром выделен новый участок последовательности.
Число совпадений нового участка последовательности с абсолютно консервативными позициями в блоках = 4.
Процент таких совпадений от общего числа абсолютно консервативных позиций в блоках (11) = 36.4%.
Число совпадений нового участка последовательности с абсолютно функционально консервативными позициями в блоках = 10.
Процент таких совпадений от общего числа абсолютно функционально консервативных позиций в блоках (23) = 43.5%.
Чтобы скачать весь проект, нажмите на ссылку.
Построение множественного "выравнивания" заведомо негомологичных (не родственных) белков и его исследование
Из базы данных Uniprot я скачала последовательности семи негомологичных белков, краткая информация о которых представлена в таблице 1.
Таблица 1. Информация о белковых последовательностях | |||
Идентификатор | Организм | Длина последовательности в аминокислотных остатках | Белок и функция |
PHRA_AGRFC | Agrobacterium fabrum | 479 | Деоксирибодипиримидин фото-лиаза |
A8IKD2_AZOC5 | Azorhizobium caulinodans | 356 | Аминогидролаза циануровой кислоты |
A3DJ38_CLOTH | Clostridium thermocellum | 870 | Металлофосфоэстераза |
Q8RG11_FUSNN | Fusobacterium nucleatum subsp. nucleatum | 335 | D-лактат дегидрогеназа |
Q74BH2_GEOSL | Geobacter sulfurreducens | 210 | HAD надсемейство гидролазы |
Q9JYV4_NEIMB | Neisseria meningitidis serogroup B | 867 | Аминопептидаза N |
Q8AAN6_BACTN | Bacteroides thetaiotaomicron | 435 | Лигаза фенилацетат-коэнзима А |
У последовательностей №3 и №6 для исследования возьмём участки длиной в 480 аминокислотных остатков. Скачать последовательности, используемые в исследовании, в формате FASTA. В результате мне удалось найти три псевдоблока, представленных на изображении ниже.
Мы видим, что такое выравнивание содержит много гэпов. Хоть в нём и можно найти некоторые совпадения в колонках и даже выделить "блоки", но таких участков настолько мало, что нельзя говорить о гомологии аминокислотных остатков и белковых последовательностей. Все совпадения имеют случайный характер. Таким образом, если при построении выравнивания удаётся обнаружить достаточное количество консервативных колонок, между которыми минимальное количество гэпов, то можно утверждать о гомологии белковых последовательностей и исслеловать гомологию аминокислотных остатков.
Скачать выравнивание в FASTA формате.
Чтобы скачать этот проект, нажмите на ссылку.