Практикум 9

Глобальное парное выравнивание последовательностей

Табл. 1. Информация о белках и результаты глобального выравнивания.
Protein name ID 1 ID 2 Score % Identity % Similarity Gaps Indels
Endonuclease III END3_ECOLI END3_BACSU 432 44.3 59.4 8 3
LexA repressor LEXA_ECOLI LEXA_BACSU 296.5 32.7 51.2 15 5
Transcriptional repressor NrdR NRDR_ECOLI NRDR_BACSU 344 47.1 63.9 9 2

Локальное парное выравнивание последовательностей

Табл. 2. Информация о белках и результаты локального выравнивания.
Protein name ID 1 ID 2 Score % Identity % Similarity Gaps Indels % Coverage 1 % Coverage 2
Endonuclease III END3_ECOLI END3_BACSU 435 45.8 61.3 2 2 99.5 96.8
LexA repressor LEXA_ECOLI LEXA_BACSU 300.5 33.5 52.4 13 4 97.5 98.5
Transcriptional repressor NrdR NRDR_ECOLI NRDR_BACSU 347 49 66.7 0 0 98.7 96.7

Контрольное выравнивание

Чтобы провести разумный контроль для проведенных выравниваний, я провела все возможныне глобальные выравнивания между последовательностями E. coli, использованными в заданиях 1 и 2, с неродственными их последовательностями B. subtilis из тех же заданий. Из этих выравниваний я выбрала выравнивание с наибольшим весом, это было выравнивание NRDR_ECOLI и LEXA_BACSU. Потом я провела локальное выравнивание тех же последовательностей, результаты — в таблице №3.

Табл. 3. Информация о контрольных выравниваниях.
Выравнивание ID 1 ID 2 Score % Identity % Similarity Gaps Indels % Coverage 1 % Coverage 2
Глобальное NRDR_ECOLI LEXA_BACSU 29 4.1 6.9 280 5 - -
Локальное NRDR_ECOLI LEXA_BACSU 30 25.5 43.1 15 3 24.2 24.9

Во-первых, видно, что и у глобального, и у локального выравниваний очень маленький вес (по сравнению с выравниваниями в заданиях 1 и 2). Во-вторых, у глобального выравнивания очень много гэпов, а у локального выравнивания очень маленькое покрытие. Это логично: по случайности с сильно большей вероятностью могут выровняться короткие последовательности.

Множественное выравнивание

Я решила выравнивать белки с мнемоникой NRDR. По запросу (id:nrdr_*) AND (reviewed:true) в UniProt нашлось 629 белков. Я взяла первые пять белков, не принадлежащие ни кишечной палочке, ни сенной палочке. Это были белки с мнемниками NRDR_STRCO, NRDR_MYCTU, NRDR_ARTS2, NRDR_AZOSB и NRDR_MYCVP.
После я провела множественное выравнивание программой muscle из EMBOSS. Результаты можно посмотреть в проекте Jalview.
Кажется, все белки выровнялись хорошо, но C-концы (начиная приблизительно со столбца 149 и до конца) у них всех наименее консервантивны. Несмотря на это, эти белки явно гомологичны.
Видно, что в столбцах 48, 49 и 50 у NRDR_STRCO, NRDR_MYCTU, NRDR_ARTS и NRDR_MYCVP находятся гэпы, а в оставшизся трех белках — нет. Я проверила, и четыре бактерии, которым принадлежат NRDR с гэпами, принадлежат кладе Actinobacteria, а оставшиеся три бактерии не принадлежат. Возможно, эти гэпы гомологичны.