Понятие о выравнивании

1. Построить вручную выравнивание фрагментов последовательности двух родственных белков


Скопировала короткие последовательности из таблицы в файл shortseqs.fasta
Заустила GeneDoc, импортировала этот файл
Вручную выровняла последовательности так, чтобы добиться максимального совпадения
Получился такой результат

ссылка на файл
Процент идентичности равен 13/24=54% (отношение выравненных столбцов к общему количеству)
Никакие другие пары АК не образуют положительную пару (руководствуясь таблицей сходства BLOSUM62) ни при каких выравниваниях

2. Пользуясь возможностями Excel построить карту локального сходства последовательностей из задания 1


Ссылка на файл Excel

Комментарий: Желтым цветом отражен оптимальный путь выравния. Голубым цветом выделены ячейки, которым соответствуют гэпы, зеленым - ячейки, по которым пересекаются несовпадающие аминокислотные остатки в моем выравнивании. Оптимальный путь совпадает с выравниванием, выполненным в первом задании.

3. Пользуясь программой bl2seq выровнять первый фрагмент из задания 1 с последовательностью вашего белка


Выходной файл
 Score = 44.3 bits (103),  Expect = 9e-12, Method: Compositional matrix adjust.
 Identities = 21/21 (100%), Positives = 21/21 (100%), Gaps = 0/21 (0%)

Query  25  INHDGKLDQAFALIDAAAEAG  45
           INHDGKLDQAFALIDAAAEAG
Sbjct  1   INHDGKLDQAFALIDAAAEAG  21

Комментарий: Последовательность из первого задания (21 АК) полностью совпадает с участком моего белка (участок с 25 по 45 аминокислотный остаток)

4. Пользуясь сервисом bl2seq выровнять последовательность моего белка с последовательностью гомологичного (родственного) белка


Мой белок - SPSE_BACSU (организм - Bacillus Subtilis). В качестве родственного определен белок RL27_SPHAL (организм - Sphingopyxis alaskensis RB2256 - Bacteria; Proteobacteria; Alphaproteobacteria; Sphingomonadales; Sphingomonadaceae; Sphingopyxis.)
Результаты:
Идентичность = 15/39 (38%),
Сходство = 22/39 (56%),
Пробелы = 1/39 (3%)
Координаты: 8-45 одного белка и 50-88 другого.
Query  8   NKTVGKDAPVFIIAEAGIN-HDGKLDQAFALIDAAAEAG  45
           N  +GKD  +F  A+  +  HDGKL + +  +D  AEA 
Sbjct  50  NVGMGKDHTLFATADGRVRFHDGKLGRKYVSVDMMAEAA  88

Выходной файл
Графическое изображение:
© Marina Kalinina