Построение

множественного выравнивания

СеместрыВторой семестр • Построение множественного выравнивания

Для построения множественного выравнивания я взял выборку белков из выдачи программы BLAST для моего белка Bontoxilysin A, используя поиск по базе RefSeq. Т.к. находок с идентичностью 50-60% не было, я включил в выборку находки с идентичностью около 40% и покрытием выравниванием 92-99% (самое меньшее для находок с идентичностью 30-40%).

С помощью программы muscle я построил множественное выравнивание этих белков. Я использовал команду muscle -in seqs.fasta -out muscle.fasta. Выравнивание в формате fasta можно скачать.

Также я построил еще одно выравнивание этих белков с помощью программы t-coffee, доступной из программы jalview. Выравнивание в формате fasta можно скачать.

Я сравнил два этих выравнивания, выровняв их с помощью программы muscle (команда muscle -profile -in1 muscle.fasta -in2 tcoffee.fasta -out muscle-tcoffee.fasta). Я отметил участки совпадения одного выравнивания с другим. В целом выравнивания оказались достаточно схожи, за исключением небольших участков несоответствия длиной до 20, трех более длинных и одного протяженного фрагмента длиной 165 в конце выравнивания на всех остальных участках выравнивания идентичны (1041 позиция из 1407, 74%).

Белок Bontoxilysin A содержит четыре домена следующих Pfam-семейств соответственно: pfam01742, pfam07952, pfam07953, pfam07951. Seed-выравнивание семейства pfam01742 (Peptidase_M27) можно скачать.

Также все представленные выше выравнивания содержатся в проекте jalview, который также можно скачать.

Дополнительное выравнивание

Все то же самое я проделал с выравниванием, полученным с помощью программы mafft. В выравнивании этого выравнивания с тем, что было полученно с помощью muscle, 1037 идентичных позиций из 1430 (72,52%), что несколько меньше аналогичного показателя для выравнивания t-coffee. Можно предположить, что выравнивание с помощью mafft в целом меньше соответствует выравниванию muscle, нежели t-coffee.

Выравнивания помещены в проект jalview, его можно скачать.

Оптимизация выравнивания

С помощью программы muscle можно также оптимизировать выравнивание, в том числе построенное с помощью других программ. Я оптимизировал выравнивание, полученное с помощью mafft, и сравнил с исходным.

На участках 26-27, 72-74, 147-152 есть единичные изменения, но после выравнивания остаются идентичными вплоть до номера позиции.
С 170 позиции выравнивания начинают сильно различаться из-за расположения гэпов. В итоге получается сдвиг, и 239 позиции исходного выравнивания соответствует 227 оптимизированного.
Затем, за исключением нескольких участков разного расположения гэпов, до 1161 позиции оптимизированного выравнивания (1175 исходного) выравнивания сходны. Затем на участке с 1161 по 1212 оптимизированное выравнивание организовано иначе. Различия в расстановке гэпов также наблюдаются с 1173 позиции до 1331, после чего выравнивания идентичны со смещением в 19.

Проект с этими выравниваниями можно скачать.