Выравнивание последовательностей.


№1. Построение выравнивания фрагментов последовательности двух родственных белков вручную


Для выполнения данного задания (и просмотра результатов) необходима программа GeneDoc.

Исходные две короткие последовательности были записаны в fasta-формате в файл shortseqs.fasta, и обработаны вручную с помощью GeneDoc. При этом нужно было обеспечить наибольшее число совпадений а/к остатков, руководствуясь также матрицей сходства BLOSUM62:
Fig.1

Данное выравнивание сохранено в файле alignment1.msf.

Рассчитаем процент идентичности двух последовательностей:

число колонок с одинаковыми буквами - 13;
общее число колонок выравнивания - 21;
процент идентичности - (13 / 21) * 100% = 61,90%.

Пользуясь матрицей сходства BLOSUM62, рассчитаем процент сходства двух последовательностей:

число колонок с одинаковыми буквами - 13;
число колонок с буквами, соответствующими сходным остаткам, - 1;
общее число колонок выравнивания - 21;
процент идентичности - (14 / 21) * 100% = 66,67%.


№2. Построение карты локального сходства последовательностей с использованием возможностей Excel


Для выполнения данного задания была составлена таблица Excel, позволяющая выявить совпадающие а/к остатки и их место в анализируемых последовательностях (alignment1.xls).

При этом были использованы функции ПСТР (для записи столбцов и строк) и ЕСЛИ (для расстановки "1" в таблицу), см. файл. Синим цветом закрашены ячейки, отвечающие выравниванию с наибольшим числом совпадений, голубым - выравнивание сходного остатка (из задания 1).

Fig.2

При выявлении соответствий очевидно прослеживаются следующие тенденции:

Начальным а/к остаткам одной последовательности должны соответствовать (что отмечается "1") начальные остатки другой последовательности, следовательно,общее направление перехода по ячейкам будет стремится к диагональному, слева направо, сверху вниз.
Если осуществлен диагональный переход между соседними ячейками, то в выравнивании это соответствует отсутствию ГЭПов и совпадению остатков.
Если переход является диагональным, но осуществляется, игнорируя одну или несколько ячеек, то, вероятно, имела место точечная замена, часть нуклеотидов не совпадает.
Если при переходе его диагональ смещается по столбцу вниз или по строке вправо, то в одной из последовательностей этому соответствует ГЭП, имела место делеция или инсерция.
Смещения по столбцу вверх и по строке влево запрещены, так как это соответствовало бы повторному сопоставлению а/к остатка.


№3. Выравнивание фрагмента с последовательностью белка ACP_BACSU с помощью программы bl2seq


С помощью программы bl2seq на сайте NCBI BLAST построим частичные выравнивания последовательности белка ACP_BACSU и его участка из задания 1.

Пройдем по гиперссылке Align, выберем вкладку blastp (это вариант для выравнивания белковых последовательностей), введем AC белка (P80643) и вторую последовательность.
В результате получим данные:
Fig.3
из которых видно, что искомая последовательность начинается с 41-го остатка и заканчивается 58-ым. Совпадение 100%.


№4. Выравнивание последовательности белка ACP_BACSU с последовательностью гомологичного белка CDD_BACPY


С помощью сервиса bl2seq построим частичное выравнивание последовательностей белков ACP_BACSU (AC P80643) и ACP_BREBN (AC C0ZFP2).

Тем же способом, что и в задании 3, получим результат:
Fig.4
Сведем данные в небольшую таблицу:

белок (ID) ACP_BACSU ACP_BREBN
организм Bacillus subtilis (Сенная палочка) Brevibacillus brevis
идентичность,% 81 81
сходство,% 91 91
число ГЭПов (символов разрыва) 0 0
Число идущих подряд гэпов 0 0
Суммарное число гэповых колонок 0 0
Координаты выровненных участков последовательность выровнена целиком, с 1 по 77 остатки последовательность выровнена целиком, с 1 по 77 остатки


Карта локального сходства ACP_BACSU и ACP_BREBN выглядит так:

Fig.5

файл *.gif

Очевидно, что данный белок очень консервативен, так как мы видим, что довольно много мутаций произошло очень компактно на коротком участке последовательности. Вероятно, это менее значимый участок (например перифетический).


3*. Те же последовательности выровнять вручную в GeneDoc, воспроизводя выравнивание bl2seq.


В моем случае это довольно просто, так как процент сходства высок, а выравнивание было только 1.

Fig.6


Импортировав последовательности в GeneDoc, я сделал только 1 преобразование, увеличивавшее число совпадений на 1, не создавая при этом большого числа лишних ГЭПов (что было бы явным признаком ошибочности действий).

Fig.6

Насколько это было оправдано - вопрос спорный, так как в исходном выравнивании вместо совпадения этих а/к остатков было отношение эквивалентности, но такая логика тоже имеет право на существовани.



назад в проекты.html


© Aleshin Vasily