Выравнивание и гомология

Задание 1.

Для выполнения данного практикума я выбрал выравнивание align_03.fasta, после чего открыл JalView и с помощью меню File -> Input Alignment -> from File загрузил выравнивание. Затем с помощью меню View -> New View создал новую вкладку в окне с тем же выравниванием, а потом с помощью меню Colour выбрал способ окраски выравнивания. Для выравнивания по BLOSUM62 я выбрал порог консервативности 30 с помощью Colour -> By Conservation и выставления ползунка на 30. Затем для каждой вкладки я построил дерево (Calculate -> Calculate Tree -> Average Distance Using BLOSUM62) и отсортировал последовательности по этим деревьям (Calculate -> Sort -> By Tree Order).
Результат задания - во вкладках "task_1_ClustalX" и "task_1_BLOSUM62".

Задание 2.

Используя определения блока и кластера из словаря терминов, я указал в выравнивании блоки, кластеры и наиболее длинный участок между блоками и кластерами. Для этого я создал новое окно с выравниванием ("task_2_blocks"), покрасил по ClustalX и рассортировал последовательности по сходству (см. описание предыдущего задания). Добавил новую строку разметки - Blocks and Clusters (нажатие правой кнопки мыши слева от строк разметки -> меню Add New Row -> ввёл название строки). Затем в этой строке я выделял аминокислотные остатки, нажимал на получившийся красный промежуток правой кнопки мыши, нажимал "Label", вводил нужную букву.
Для обозначения участка выравнивания, на котором некоторые последовательности будут, предположительно, гомологичны, а остальные - нет, я открыл новую вкладку "task_2_strange", покрачил выравнивание по BLOSUM62, нашёл нужный участок, ввёл новую строку разметки "Strange plot" и отметил нужный участок буквой Н. Именно этот участок я выбрал потому, что у трёх последовательностей из шести (MACCJ, CELLD и BUTPB) в позициях 131 и 132 находились аминокислоты D и L, а у остальных - другие.
Лирическое отступение: остатки в последовательностях можно назвать гомологичными, если они произошли от одного и того же остатка в предковой последовательности.

Задание 3.

Для выполнения этого задания я открыл новое окно с выравниванием ("task_3"), покрасил выравнивание по ClustalX и выбрал один из блоков (с позиции 43 по позицию 54). Итого, в блоке 12 аминокислот. Из них в блоке 7 абсолютно консервативных колонок (58,3% от всего блока), 2 - функционально консервативных (16,7%), 1 - консервативная на 83,3% (48 позиция, все аминокислотные остатки - К, кроме одной - Q) (8,33% от блока), 1 - функционально консервативная на 66,7% (2 S и 2 T, остальные - V и I) (8,33%), 1 - абсолютно не консервативная (8,33%).
Самый длинный участок, не принадлежащий блокам или кластерам, начинается с 55-й позиции и кончается 95-й, итого - 41 позиция. Всего в этом участке нашлось 15 гэпов (6,1%).

Задание 4.

Для выполнения этого задания я скачал последовательность sequence_03.fasta. Затем я открыл новое окно с выравниванием ("task_4"), осортировал последовательности по сходству, покрасил выравнивание по ClustalX и добавил новую последовательность в выравнивание с помощью меню File -> Add sequences -> From File. Затем я перешёл в режим "стрелки" (нажал F2) и нажатием клавиши Shift и левой кнопки мыши сдвинул последовательность после 23-го глутамина на 4 гэпа вперёд, после 53-го пролина на 2 гэпа, после 60-го глицина на 1 гэп.

Задание 5.

В новое окно с отсортированным и окрашенным выравниванием ("task_5") я вставил укороченную последовательность своего белка - YP_002729488_shorted.fasta. После этого описанным выше способом я попытался вручную выровнять эту последовательность с уже имеющимся выравниванием. Результат неутешителен: из 174 аминокислотных остатков последовательности консервативно или функционально консервативно с колонками выравнивания совпали 40 аминокислотных остатков (примерно 23%).

Задание 6.

С помощью меню File -> Fetch sequences я выбрал базу данных (Uniprot), ввёл в окошко запроса АС последовательностей (C1DWK1, D9Q2Q0, A8A8H6, B8D2N2, I0A0C8), и после нажатия клавиши ОК получил новое окно с последовательностями, расположенными друг над другом. Затем с помощью меню Web Services -> Alignment -> Muscle with Default я выровнял эти последовательности и покрасил получившееся выравнивание по ClustalX. Затем, следуя определению блока из словаря терминов, я сумел найти лишь один блок во всём выравнивании. О кластерах речи даже не идёт. Затем я выбрал участок выравнивания, на котором три из пяти последовательностей (C1DWK1, D9Q2Q0, I0A0C8) были похожи между собой сильнее, чем остальные две. Причём у этих оставшихся двух последовательностей (A8A8H6 и B8D2N2) прослеживаются следы сходства с первыми тремя. Так, у последовательности A8A8H6 во второй позиции "участка" находится аминокислота лизин (как в группе похожих последовательностей), а у B8D2N2 - серин в третей позиции. Примерная последовательность "участка" у трёх сходных аминокислот такова: G-K-[TS]-T.
 
Скачать JalView проект с результатами выполнения практикума можно по этой ссылке.
 
 
Главная страница

 

© Головачев Ярослав