Множественное выравнивание последовательностей

1.Выравнивание набора гомологов белка SPSE_BACSU


a. Получение гомологов белка SPSE_BACSU, используя BLAST на NCBI.
C гомологами у моего белка совсем плохо. Нашелся мой белок + 3 гомолога(при ограничении на e-value 0,001). Добавлять последовательности, которые находятся при увеличении порога e-value, не вижу смысла.
Выбрала эти 4 последовательности:
sw:spse_bacsu
sw:rimo_sphal
sw:sias_human
sw:y1065_metja

После выборки последовательностей записала их в файл myproteins.list.


Выполнив команду
seqret @myproteins.list myproteins.fasta

через Putty, получила файл myproteins.fasta с последовательностями выбранных гомологов.

b. Построение множественного выравнивания белка GUAD_BACSU и всех найденных гомологов.
Откроем JalView http://www.jalview.org/download.html
Откроем файл myproteins.fasta. Чтобы выровнять, после открытия полученного файла с (невыровненными) последовательностями используем программу через меню WebService => Alignment. Выравняем опцией Tcoffee (настройки по умалчанию). Красим по BLOSUM62, которая учитывает веса замен
Получился вот такой файл выравнивания.

Само выравнивание

alignment.jar .

c. Описание структуры выравнивания.
На мой взгяд можно отметить следующие участки консервативности в выравнивании:
--------------------

Координаты по столбцам выравнивания - 43-51 и 54-62
Координаты по остаткам моего белка - 16-24 и 26-34

--------------------

Координаты по столбцам выравнивания - 78-85
Координаты по остаткам моего белка - 45-52

--------------------

Координаты по столбцам выравнивания - 165-170
Координаты по остаткам моего белка - 126-131

--------------------

Координаты по столбцам выравнивания - 277-286
Координаты по остаткам моего белка - 185-194

--------------------

Координаты по столбцам выравнивания - 318-333
Координаты по остаткам моего белка - 226-241

--------------------

Координаты по столбцам выравнивания - 353-364 и 391-404
Координаты по остаткам моего белка - 245-256 и 281-293

Если смотреть на выравнивание целиком, видно, что RIMO_SPHAL достаточно далек от остальных белков
У него есть участки-вставки, которых нет в других белках, да и в участках консервативности а/о остатки этого белка не всегда консервативны трем другим последовательностям).
В общем, на мой взгляд, этот белок если и родственник, то далекий, и успел сильно изменится
d. Функционально консервативные позиции.
Наиболее консервативный участок, на мой взгляд (покрашено в Clustalx без учета консервативности)

Видно, что чаще встречаются такие а/о, как G,A,I,L (неполярные и незаряженные). Из групп из 2х а/о можно отметить AD,LD,AE (если учесть, что характеристически D и E очень близки, то такое сочетание может оказаться не случайным). Еще интересно, что пролин встречается только в начале и в конце этого участка.

2. Muscle


Результат, полученный в SRS delta.fasta
После выравнивания командой muscle в putty delta_aligned.fasta
Выравнивание в формате MSF, полученное Jalview delta.msf
А это изображение получено программой Jalview, используя выравнивание muscle и расцветку по идентичности
Видно, что последовательности почти на всей длине консервативны. Гэпов мало, а там, где произошли замены аминокислотных остатков, замена, в основном, гомологичная.