Из UniProt были скачаны все описанные идентификаторы ECOLI и BASCU, разделением столбцов были получины разные мнемоники и затем с помощью ВПР программы Excel были выписаны все повторяющиеся белки. Для исследования были выбраны белки с мнемониками: 6PGD, 6PGL, ACCA.
Результаты выравнивания приведены в таблице 1, таблицу с идентификаторами можно увидеть здесь.
Protein name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels |
6-phosphogluconate dehydrogenase, decarboxylating | 6PGD_ECOLI | 6PGD_BACSU | 1718,0 | 70% | 83,4% | 3 | 3 |
6-phosphogluconolactonase | 6PGL_ECOLI | 6PGL_BACSU | 304,5 | 25,3% | 42% | 62 | 11 |
Acetyl-coenzyme A carboxylase carboxyl transferase subunit alpha | ACCA_ECOLI | ACCA_BACSU | 814,5 | 51,1% | 66% | 14 | 4 |
Таблица 1. Результаты глобального выравнивания
Protein name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
6-phosphogluconate dehydrogenase, decarboxylating | 6PGD_ECOLI | 6PGD_BACSU | 1719 | 70,1% | 83,6% | 3 | 3 | 99,8% | 99,8% |
6-phosphogluconolactonase | 6PGL_ECOLI | 6PGL_BACSU | 317 | 30,6% | 48,7% | 16 | 6 | 76,1% | 75,1% |
Acetyl-coenzyme A carboxylase carboxyl transferase subunit alpha | ACCA_ECOLI | ACCA_BACSU | 823,5 | 53,8% | 69,6% | 3 | 2 | 97,8% | 95,1% |
Таблица 2. Результаты локального выравнивания
Score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 | |
Needle | 66,5 | 14,2% | 23,3% | 296 | 24 | ||
Water | 86 | 23,2% | 34,1% | 65 | 7 | 59,8% | 49,1% |
Таблица 3. Выравнивание неродственных белков
Для выравнивания были выбраны белки TOLA_ECOLI (Tol-Pal system protein TolA) и VMLR_BACSU (Ribosome protection protein VmlR). Как видно из таблицы 3 эти белки действительно негомологичны и небольшие совпадения в последовательностьях являются случайными.
Для множественного выравнивания была выбрана мнемоника 6PGD (6-phosphogluconate dehydrogenase, decarboxylating), сеанс поиска по которой выдал 55 белков. Из них были выбраны: 6PGD_HUMAN, 6PGD_ECOLI, 6PGD_RAT, 6PGD_SHEEP, 6PGD1_YEAST, 6PGD_BACSU, 6PGD_MOUSE. Отметив их и нажав Align, мы смоги выровнять эти последовательности, после чего файл с выравниваниями был скачан, переведен в txt формат и открыт в Jalview. Colour>Percentage identity окрасило наше выравнивание по проценту идентичности. В итоге мы получили файл 4tsk.jvp в формате jvp.
В целом белки очень похожи друг на друга. Некоторые участки полностью идентичны (127-132, 183-198). 6PGD_ECOLI и 6PGD_BACSU оказались немного короче остальных и обладают меньшей идетичностью. 6PGD_HUMAN, 6PGD_RAT, 6PGD_SHEEP, 6PGD_MOUSE обладают более чем 90% идентичностью, видимо данный белок почти одинаков у всех млекопитающих.