Практикум 9
1. Глобальное парное выравнивание гомологичных белков
| Protein name | ID 1 | ID 2 | score | % Identity | % Similarity | Gaps | Indels |
|---|---|---|---|---|---|---|---|
| tRNA N6-adenosine threonylcarbamoyltransferase | TSAD_ECOLI | TSAD_BACSU | 708.5 | 41.7 | 62.4 | 13 | 4 |
| Aconitate hydratase A | ACNA_ECOLI | ACNA_BACSU | 2647.5 | 56.4 | 71.7 | 18 | 6 |
| Phosphatidate cytidylyltransferase | CDSA_ECOLI | CDSA_BACSU | 358.5 | 32.3 | 51.9 | 40 | 11 |
2. Локальное парное выравнивание гомологичных белков
| Protein name | ID 1 | ID 2 | score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
|---|---|---|---|---|---|---|---|---|---|
| tRNA N6-adenosine threonylcarbamoyltransferase | TSAD_ECOLI | TSAD_BACSU | 711.5 | 43.6 | 65.2 | 5 | 3 | 97.03 | 94.79 |
| Aconitate hydratase A | ACNA_ECOLI | ACNA_BACSU | 2647.5 | 56.6 | 71.9 | 16 | 4 | 100 | 99.78 |
| Phosphatidate cytidylyltransferase | CDSA_ECOLI | CDSA_BACSU | 362.5 | 33.0 | 52.9 | 36 | 9 | 98.59 | 98.51 |
3. Результат применения программ выравнивания к неродственным белкам
| Тип выравнивание | Название белка и ID 1 | Название белка и ID 2 | score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
|---|---|---|---|---|---|---|---|---|---|
| Локальное | Ribonuclease R RNR_ECOLI | Coproporphyrinogen III oxidase CGOX_BACSU | 65.5 | 17.5 | 32.6 | 177 | 21 | 55.10 | 85.31 |
| Глобальное | Ribonuclease R RNR_ECOLI | Coproporphyrinogen III oxidase CGOX_BACSU | 35.0 | 12.2 | 22.4 | 459 | 31 | 100 | 100 |
В принципе, для случайно выбранных белков процент сходных и схожих букв довольно большой, как и в глобальном выравнивании, так и в локальном ( учитывая что процент покрытия обоих белков довольно высок). Чтоб убедиться в негомологичности белков я посмотрел на их 3D структуры. Можно конечно заметить схожести в наличии бета-листов в районе 275-375 аминокислотных остатков. Но других особых закономерностей я не увидел, потому верю в их негомологичность.
4. Множественное выравнивание белков и импорт в Jalview
Я выбрал мнемонику TSAD и по запросу получил 816 белков, чьи индетефикаторы начинаются с этой мнемоники. Рекомендованное полно имя белка - tRNA N6-adenosine threonylcarbamoyltransferase.
Среди всех белков я выбрал следующие : TSAD_THEMA ,TSAD_MYCTU ,TSAD_MANHA ,TSAD_STAA8 ,TSAD_LISMF. Для выравнивания их последовательностей я использовал Jalview . Посследовательности были получены через Fetch sequences c Uniprot в качества базы данных . А выравнивание было выполнено через Muscle with Defaults. Для того, чтобы ярче увидеть сходство последовательностей, в качестве Colour я выбрал Percentage identity со степенью консервативности 20.
В результате выравнивания можно выделить несколько консервативных участков : столбцы 12-21 ,43-45 ,52-63, 74, 89, 91, 93-103, 107, 110-113, 117, 121-130, 140-154, 168-193, 210-212, 224-230, 254-267, 286-292, 295-296, 319-331. Такое количество консервативынх участков указывает на гомологичность этих белков.