Практикум 9
Глобальное парное выравнивание последовательностей
Protein name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels |
---|---|---|---|---|---|---|---|
Endonuclease III | END3_ECOLI | END3_BACSU | 432 | 44.3 | 59.4 | 8 | 3 |
LexA repressor | LEXA_ECOLI | LEXA_BACSU | 296.5 | 32.7 | 51.2 | 15 | 5 |
Transcriptional repressor NrdR | NRDR_ECOLI | NRDR_BACSU | 344 | 47.1 | 63.9 | 9 | 2 |
Локальное парное выравнивание последовательностей
Protein name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | % Coverage 1 | % Coverage 2 |
---|---|---|---|---|---|---|---|---|---|
Endonuclease III | END3_ECOLI | END3_BACSU | 435 | 45.8 | 61.3 | 2 | 2 | 99.5 | 96.8 |
LexA repressor | LEXA_ECOLI | LEXA_BACSU | 300.5 | 33.5 | 52.4 | 13 | 4 | 97.5 | 98.5 |
Transcriptional repressor NrdR | NRDR_ECOLI | NRDR_BACSU | 347 | 49 | 66.7 | 0 | 0 | 98.7 | 96.7 |
Контрольное выравнивание
Чтобы провести разумный контроль для проведенных выравниваний, я провела все возможныне глобальные выравнивания между последовательностями E. coli, использованными в заданиях 1 и 2, с неродственными их последовательностями B. subtilis из тех же заданий. Из этих выравниваний я выбрала выравнивание с наибольшим весом, это было выравнивание NRDR_ECOLI и LEXA_BACSU. Потом я провела локальное выравнивание тех же последовательностей, результаты — в таблице №3.
Выравнивание | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | % Coverage 1 | % Coverage 2 |
---|---|---|---|---|---|---|---|---|---|
Глобальное | NRDR_ECOLI | LEXA_BACSU | 29 | 4.1 | 6.9 | 280 | 5 | - | - |
Локальное | NRDR_ECOLI | LEXA_BACSU | 30 | 25.5 | 43.1 | 15 | 3 | 24.2 | 24.9 |
Во-первых, видно, что и у глобального, и у локального выравниваний очень маленький вес (по сравнению с выравниваниями в заданиях 1 и 2). Во-вторых, у глобального выравнивания очень много гэпов, а у локального выравнивания очень маленькое покрытие. Это логично: по случайности с сильно большей вероятностью могут выровняться короткие последовательности.
Множественное выравнивание
Я решила выравнивать белки с мнемоникой NRDR. По запросу (id:nrdr_*) AND (reviewed:true) в UniProt нашлось 629 белков. Я взяла первые пять белков, не принадлежащие ни кишечной палочке, ни сенной палочке. Это были белки с мнемниками NRDR_STRCO, NRDR_MYCTU, NRDR_ARTS2, NRDR_AZOSB и NRDR_MYCVP.
После я провела множественное выравнивание программой muscle из EMBOSS. Результаты можно посмотреть в проекте Jalview.
Кажется, все белки выровнялись хорошо, но C-концы (начиная приблизительно со столбца 149 и до конца) у них всех наименее консервантивны. Несмотря на это, эти белки явно гомологичны.
Видно, что в столбцах 48, 49 и 50 у NRDR_STRCO, NRDR_MYCTU, NRDR_ARTS и NRDR_MYCVP находятся гэпы, а в оставшизся трех белках — нет. Я проверила, и четыре бактерии, которым принадлежат NRDR с гэпами, принадлежат кладе Actinobacteria, а оставшиеся три бактерии не принадлежат. Возможно, эти гэпы гомологичны.