Множественное выравнивание. Занятие 4.
работа с Jalview.

№1. Выравнивание набора гомологов ACP_BACSU.


Воспользуемся Blast для того, чтобы отыскать возможные гомологи ACP_BACSU.

Выборка получилась очень обширная, поэтому, в соответствии с заданием выберу из нее белки с разным процентом идентичности, не превышающим 90 и не ниже 40%.

Таблица 1. Использованные гомологи

Организм ID AC
Bacillus subtilis ACP_BACSU P80643
Brevibacillus brevis ACP_BREBN C0ZFP2
Listeria welshimeri serovar 6b ACP_LISW6 A0AJR1
Haemophilus parasuis serovar 5 ACP_HAEPS B8F7C3
Vibrio parahaemolyticus ACP_VIBPA P0A2W2
Tolumonas auensis ACP_TOLAT C4L8E4
Pseudomonas putida ACP_PSEP1 A5W713
Geobacter metallireducens ACP_GEOMG Q39V90
Akkermansia muciniphila ACP_AKKM8 B2UQS2
Oceanobacillus iheyensis ACP_OCEIH Q8ER06

С помощью программы seqret на сервере факультета и команды "seqret @myproteins.list myproteinsfinal.fasta"
был создан файл, позволивший выполнить множественное выравнивание.

После покраски по идентичности в соответствии с матрицей BLOSUM62 оно приобрело следующий вид.

Fig.1

Опишем структур выравнивания.

1. Участки с повышенной долей консервативных позиций.
Данное выравнивание предоставило немало позиций с повышенной степенью консервативности.

К сожалению, несмотря на то, что это лучшее выравнивание из того, что я перепробовал, оно, очевидно, неверно выравнивает начало последовательности, стремясь не вводить гепы в цепь. В результате этого старт-кодон метионин выравнивается не сам с собой, а с другими сходными остатками.

Внося эту поправку опишем выравнивание.

Во-первых, консервативна первая позиция (метионин), содержащая старт-кодон.
Это говорит об отсутствии посттрансляционной модификации начального участка цепи у всех исследуемых белков).

Во-вторых, это позиции 9 и 10 с лизином или аргинином и валином соответственно.

Далее с 13 по 18 позиции идут остатки со схожими свойствами (внутри столбцов).
Из них три столбца гидрофобны: преимущественно изолейцин и валин, далее идет столбец, содержащий кислоту (Glu или Asp) и столбец глутамина.
Закрывает этот участок столбец лейцина.

В-четвертых, 20-й и 25-й столбцы гидрофобны (валин).

Далее идет самый совпадающий участок: на 31 месте во всех белках соит фенилаланин, а с 33 по 47 остатки очень консервативны.
5 раз здесь встречаются кислоты (Glu и Asp), один раз Треонин, один раз метионин, остальные позиции заняты гидрофобными остатками (Leu, Val, Ala), в 36 позиции во всех цепях кроме одной имеется глицин.

Также довольно консервативен участок с 49 по 53 столбец (лейцин, затем 3 глутаминовых кислоты и фенилаланин).

На 56 и 57 позициях жестко фиксированы Glu и Ile, а с 59 по 62 позиции подряд идут 3 кислоты и замыкает их аланин.
В 65 позиции фиксирован изолейцин, 67 и 68 места занимают треонин (или серин) и валин, 71 и 72 позиции гидрофобны (аланин, валин, изолейцин), а на 74 месте стоит тирозин, 75 позиция гидрофобна.

Об отсутствии биологического смысла можно судить по наличию или отсутствию тех или иных а/к остатков у схожих белков.

В первую очередь речь идет о наличии гепов. Они имеются в исследуемых белках только в конце (80-й столбец) и в начале последовательности (это точно четвертый и либо третий, либо пятый столбец).

Также можно говорить, что столбцы с 20 по 30, а также со 2 по 10 не очень консервативны из-за большого количества закрепившихся мутаций и, вероятно, отсутствия или незначительности отбора по этим группам.

Всего в данном выравнивании функционально консервативные позиции, представленные не идентичными, а схожими по свойствам остатками подразделяются на 3 группы, внутри которых возможны взаимные замены.
Это Аргинин и лизин; валин, лейцин, изолейцин и аланин; глутаминовая и аспарагиновая кислоты; глутамин и аргинин; треонин и серин.

Как мы видим, аспартат и глутамат программой учитывается, считать их дополнительно не нужно.

Наиболее часто в консервативных позициях располагаются глутаминовая кислота (7 столбцов), валин, изолейцин и аспарагиновая кислота (по 6 столбцов), а также лейцин (5 столбцов).
Остальные остатки не настолько консервативны.

Ссылка на файл с выравниванием ACP_BACSUseq.msf. Файл также лежит в рабочей директории.


№2. Программа Muscle


Воспользовавшись полученными ранее навыками с помощью специального поиска отыщем интересующие нас белковые последовательности дельтавирусов.

Полученное количество результатов (17) указывает на правильность поиска.

В соответствии с указаниями выровняем последовательности с помощью программы на сервере командой "muscle -in delta.fasta -out delta_aligned.fasta".

Полученный файл откроем в Jalview и убедимся, что, во первых, все найденные результаты нам подходят, во-вторых, что последовательности действительно выровнены.

Раскраска по идентичности и по сходству остатков активно применялась мной в предыдущем задании, поэтому, для разнообразия и обучения я решил выбрать раскраску по гидрофобности и объяснить все использованные цвета.

Fig.1


Довольно очевидно, что бесцветными остались столбцы, содержащие хотя бы 1 геп или включающие сильно различающиеся по свойствам остатки (BLOSUM62).

Традиционно синим цветои обозначается вода. Так и здесь гидрофильные а/к остатки окрашены в синий, тем ярче, чем больше консервативность столбца.

Аналогично, гидрофобные остатки орашены в теплые оттенки от красного до розового и фиолетового в соответствии с их консервативностью, собственными химическими свойствами (поэтому метионин не красный, а бордовый) и окружением (из-за этого, например, глицин может быть окрашен как в розовый, так и в фиолетовый, если соседними остатками будут лейцин или лизин).

Ссылка на файл с выравниванием delta.msf.
Файл также лежит в рабочей директории.




назад в проекты.html


© Aleshin Vasily