1.Выравнивание набора гомологов белка SPSE_BACSU
a. Получение гомологов белка SPSE_BACSU, используя BLAST на NCBI.
C гомологами у моего белка совсем плохо. Нашелся мой белок + 3 гомолога(при ограничении на e-value 0,001). Добавлять последовательности, которые находятся при увеличении порога e-value, не вижу смысла.
Выбрала эти 4 последовательности:
sw:spse_bacsu
sw:rimo_sphal
sw:sias_human
sw:y1065_metja
После выборки последовательностей записала их в файл
myproteins.list.
Выполнив команду
seqret @myproteins.list myproteins.fasta
через Putty, получила файл
myproteins.fasta с последовательностями выбранных гомологов.
b. Построение множественного выравнивания белка GUAD_BACSU и всех найденных гомологов.
Откроем JalView
http://www.jalview.org/download.html
Откроем файл
myproteins.fasta. Чтобы выровнять, после открытия полученного файла с (невыровненными)
последовательностями используем программу через меню
WebService => Alignment. Выравняем опцией Tcoffee (настройки по умалчанию). Красим по
BLOSUM62, которая учитывает веса замен
Получился вот такой
файл выравнивания.
Само выравнивание
alignment.jar .
c. Описание структуры выравнивания.
На мой взгяд можно отметить следующие участки консервативности в выравнивании:
--------------------
Координаты по столбцам выравнивания - 43-51 и 54-62
Координаты по остаткам моего белка - 16-24 и 26-34
--------------------
Координаты по столбцам выравнивания - 78-85
Координаты по остаткам моего белка - 45-52
--------------------
Координаты по столбцам выравнивания - 165-170
Координаты по остаткам моего белка - 126-131
--------------------
Координаты по столбцам выравнивания - 277-286
Координаты по остаткам моего белка - 185-194
--------------------
Координаты по столбцам выравнивания - 318-333
Координаты по остаткам моего белка - 226-241
--------------------
Координаты по столбцам выравнивания - 353-364 и 391-404
Координаты по остаткам моего белка - 245-256 и 281-293
Если смотреть на выравнивание целиком, видно, что RIMO_SPHAL достаточно далек от остальных белков
У него есть участки-вставки, которых нет в других белках, да и в участках консервативности а/о остатки этого белка не всегда консервативны трем другим последовательностям).
В общем, на мой взгляд, этот белок если и родственник, то далекий, и успел сильно изменится
d. Функционально консервативные позиции.
Наиболее консервативный участок, на мой взгляд (покрашено в Clustalx без учета консервативности)
Видно, что чаще встречаются такие а/о, как G,A,I,L (неполярные и незаряженные). Из групп из 2х а/о можно отметить AD,LD,AE (если учесть, что характеристически D и E очень близки, то такое сочетание может оказаться не случайным). Еще интересно, что пролин встречается только в начале и в конце этого участка.
2. Muscle
Результат, полученный в SRS
delta.fasta
После выравнивания командой muscle в putty
delta_aligned.fasta
Выравнивание в формате MSF, полученное Jalview
delta.msf
А это изображение получено программой Jalview, используя выравнивание muscle и расцветку по идентичности
Видно, что последовательности почти на всей длине консервативны. Гэпов мало, а там, где произошли замены аминокислотных остатков, замена, в основном, гомологичная.