На главную

На страницу семестров

Назад

JalView



Задание 1. Построение выравнивания последовательностей гомологичных белков

Из таблицы было выбрано три пары белков из семейства HSP70, принадлежащих представителям разных доменов. С помощью средств bash, последовательности этих белков были извлечены в текстовые файлы. Для определения консервативности последовательностей, отыскания гомологичных белков и выяснеия их родства, с помощью программы Jalview было построено выравнивание 1 с раскраской по схеме ClustalX с условием Identity Threshold = 100%. Из всех предложенных алгоритмов результат работы "Mafft with Defaults" показался мне наиболее правильным. Поля консервативности и др. были скрыты намеренно, чтобы остображалась лишь релевантная информация.

Ссылка на программу bash (для вызова в командной строке PuTTY: bash alignment.sh)



Выравнивание 1. Шесть белков семейства HSP70 с раскраской по схеме ClustalX с условием Identity Threshold = 100%

Для расчета параметров консервативности была использована команда infoalign из пакета EMBOSS.
Команда infoalign и её атрибуты применялись к выравниванию, полученному в программе JalView.
Так как в рамках нашего курса гэпом считается несколько подряд идущих символов, для их подсчёта был выбран атрибут -gaps. Если считать количество гэпов в целом выравнивании, то, с помощью программных средств, можно убедиться, что их 207.

Таблица 1. Параметры консервативности последовательностей белков
Имя последовательностиДлина последовательностиДлина выравниванияАбсолютно консервативные позиции % абсолютно консервативных позицийФункционально консервативные позиции% функционально консервативных позицийGaps % gapsКонсервативные на 70%% консервативных на 70%
Clostridium_beijerinckii_DNAK_CLOB8_1-61461473913221,522930,99203,2628838,972
Halobacterium_salinarum_DNAK_HALS3_1-62962974013220,9922930,95182,8628838,919
Methanosaeta_thermophila_DNAK_METTP_1-61561574013221,4622930,95203,2528838,919
Yersinia_pestis_HSCA_YERPE_1-65065075513220,3122930,33192,9228838,146
Homo_sapiens_HS71A_HUMAN_1-64164173813220,5922931,03132,0328839,024
Saccharomyces_cerevisiae_HSP7Q_YEAST_1-65765774313220,0922930,82152,2828838,762



Выравнивание 2. Последовательности с разметкой: 80% или более консервативных (C), абсолютно функционально консервативные (F), позиции с гэпами (G)


К полученному выравниванию было добавлено поле "Разметка". Оно отражает следующие свойства: G - участки выравнивания, содержащие гэпы; C - участки, консервативные на 80 и более %; F - функционально консервативные участки выравнивания. Видно, что, в общем, в хорошем выравнивании достаточно часто встречаются как консервативные позиции (С), так и абсолютно функционально консервативные позиции (F). На выбранном участке имеется несколько F позиций. Начиная со столбца 530 и заканичвая столбцом 680, было отмечено как минимум по три случая состояния позиций. Так и далее, столбцы с номерами 560 и 581 содержат остатки изолейцина и лейцина: чрезвычайно сходных аминокислот. Позиции 599 и 611 представлены остатками изолейцина и валина. Также можно заметить, что в общее выравнивание содержит восемь крупных блоков, размер которых увеличивается от периферии к центру.




Задание 2. Эволюция последовательности белка

Для имитации эволюционного пути и проверки алгоритмов JalView на способность адекватно отражать такой процесс, было проведено восемь раундов искуственной мутации, эквивалентных 800м годам реального эволюционного процесса для части (1-100) аминокислотной последовательности белка сиалидазы из бактерии Clostridium beijerinckii. Данные манипуляции были проведены с использованием средств bash и пакета EMBOSS.
Выбранный для мутирования файл с участком последовательности Clostridium beijerinckii:

>p1 sialidase [Clostridium beijerinckii]
MIRRNKRILSLTLSMAVFTTMFMSTSFITKAETVSLGANSEITSNASTESTAVATNIALN
KPSTASSVTGGNTASLAVDGNAGTRWESAQGSDPQWISID

В выравнивании 3 представлены исходная последовательность предполагаемого предка и последовательности восьми раундов мутаций p1> p2 > p3 > ... > p9. При помощи команды msbar каждый раунд вносится семь точечных мутаций различных типов. Решено проводить восемь раундов с целью более вероятного обнаружения ошибки программы в дальнейшем.



Выравнивание 3. Эволюция участка аминокислотной последовательности сиалидазы. Результат работы программы




Выравнивание 4. Исправленное выравнивание, отражающее эволюцию участка аминокислотной последовательности сиалидазы


По исправленному выравниванию 4 можно проследить эволюционный путь последовательности:

  1. Поз. 2, замена изолейцина на треонин от p1 к p2
  2. Поз. 8, замена изолейцина на глутамин от p4 к p5
  3. Поз. 10, делеция серина от p2 к p3
  4. Поз. 15, инсерция глутаминовой кислоты от p4 к p5
  5. Поз. 18, делеция валина от p4 к p5
  6. Поз. 21, инсерция серина от p3 к p4
  7. Поз. 24, делеция фенилаланина от p3 к p4
  8. Поз. 25, делеция метионина от p4 к p5
  9. Поз. 26, инсерция глицина от p2 к p3
  10. Поз. 27, инсерция серина от p6 к p7
  11. Поз. 35, делеция аланиня от р1 к р2
Обсуждение
Я думаю, что, например, в позициях 23-25 алгоритм выровнял неверно, так как маловероятно, что:
Так, если верить выравниванию, в столбце 23 произошла делеция метионина от p4 к p5 и его инсерция от р5 к р6. Видно, что пропущенный метионин оказался в выравнивании справа, поэтому данная позиция была исправлена. Программа стремится обеспечить больший вес выравнивания, компонуя столбцы согласно наибольшим весам в матрице. Заметно, что такой подход не может оставаться без проверки и прослеживание эволюционных событий на основании последовательностей, возможно, нуждается в стороннем независимом подтверждении.




Задание 3. Эволюция последовательности ДНК

Для имитации эволюции последовательности человеческого гуанин-связывающего регуляторного белка использовался скрипт bash. Применительно к фрагменту белка из 78 нк., переведённых в а.м.о., проследим возможные изменения в семи поколениях при менее жёсткой радиации (-count 4).

Выбранный для мутирования файл с участком последовательности нуклеотидов:

>M16514.1 Human guanine nucleotide-binding regulatory protein (G protein) gene, 3' end
GGCCCCCGTCCCGCGGCCCCCAGCCGCCCCCAACCCTGCCCCACGGGGCCCGGCGCCATG
AGTGAGCTGGAGCAACTG


Выравнивание 5. Эволюционный путь транслированной последовательности




Выравнивание 6. Исправленное выравнивание последовательностей 1




Выравнивание 6. Исправленное выравнивание последовательностей 2


Из выравниваний видно, что, как и в случае с аминокислотной последовательностью, наблюдается большое количетво неверно выровненых столбцов. Исправлять такие выравнивания оказалось гораздо сложнее и интереснее предыдущих. Похоже, что в таких случаях программа выравнивает лучше. Интересно, что при мутировании не образоватось стоп-кодонов. Также стоит отметить, что при меньшей скорости мутирования количество мутаций сравнимо и даже превосходит предыдущий случай, что может говорить о большей чувствительности к мутациям благодаря пропорции ген. кода. Что не удивительно.

Дополнения и исключения из правил или Take home messages

Возьму на себя смелость привести несколько контрпримеров к тезисам в презентации.

“Последовательность это всё...”, "Эволюционирует нуклеотидная последовательность генома..."

Существуют данные о наследовании метилирования или о гистоновом коде.

"Только мутации в половых клетках наследуются..."

Умозрительно- мутировавшие гены могут захватываться ретровирусами, переноситься через плаценту и встраиваться в наследственный материал зародыша. В природе не найдено подобных механизмов, но принципиальная возможность процесса показана эксериментально. Также не стоит забывать о организмах, которые размножаются только вегетативно.

"В гомологичных последовательностях живущих сегодня организмов мы видим почти исключительно мутации, прошедшие отбор..."

Гомологичные последовательности, как правило, представленны кодирующими и некодирующими участками. Интроны вырезаются из незрелой РНК в процессе сплайсинга, а экзоны сшиваются в зрелый продукт. Так как интроны, чаще всего, не несут ярко выраженной смысловой нагрузки, в них накапливаются мутации и содержание AT пар выше такового в экзонах.

“Мутации происходят постоянно и в случайных местах генома...”, "Последовательность белка обычно под стабилизирующем отбором, т.е. отбор действует против мутаций а.к.о..."

Известны участки с повышенной скоростью мутирования. Например, кассеты антител или участки, кодирующие белки-участники иммунной системы. Подобные объекты и процессы, по- моему, обсуждаются в книгах Александра Маркова "Рождение сложности" и "Эволюция".

“Единичная делеция или вставка полностью меняет последовательность белка...”

Конечно, вероятность потери функции белком чрезвычайно велика, но можно придумать такую модель, и, по- моему, я где- то слышал о подобном реально существующем механизме, когда рибосома скользит по иРНК, находит стартовый кодон, синтезирует часть белка, а после проскальзывает участок до следующей инициаторной или иной области. Изменение рамки считывания в промежутке может не приводить к изменению последовательности.

"Летальные, вредные и слабовредные мутации вымываются из популяции..."

Существует множество примеров, когда организмы с вредными и слабовредными мутациями имеют эволюционное преимущество. Самым простым примером является лучшая периносимость малярии людьми с серповидно- клеточной анемией. Конечно, в данном случае мутацию можно уже рассматривать как частично полезную, но это уже вопрос терминов и условий.

"Для белков есть проверка: сходство структур..."

Как мы могли убедиться в блоке визуализации молекул, активные центры некоторых негомологичных белков имеют схожие пространственные структуры, приспособленные для выполнения схожих функций. Возникает аналогия.








© Кравченко Павел
2017