Таблица 1
Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels |
---|---|---|---|---|---|---|---|
Adenylate kinase | KAD_ECOLI | KAD_BACSU | 527.5 | 46.4% | 65.8% | 13 | 3 |
Primosomal protein N' | PRIA_ECOLI | PRIA_BACSU | 1139.5 | 33.3% | 51.1% | 95 | 18 |
Ribulokinase | ARAB_ECOLI | ARAB_BACSU | 769.0 | 30.6% | 48.7% | 56 | 14 |
Таблица 2
Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
---|---|---|---|---|---|---|---|---|---|
Adenylate kinase | KAD_ECOLI | KAD_BACSU | 527.5 | 47.2% | 67.0% | 9 | 2 | 99.5% | 98.2% |
Primosomal protein N' | PRIA_ECOLI | PRIA_BACSU | 1145.5 | 33.5% | 51.4% | 94 | 17 | 99.6% | 99.5% |
Ribulokinase | ARAB_ECOLI | ARAB_BACSU | 776.0 | 31.9% | 50.2% | 44 | 12 | 97.2% | 95.4% |
Два белка, выравнивание которых приведено в этом задании (а именно ISCA_ECOLI (Iron-binding protein IscA) и ALBC_BACSU (Putative ABC transporter ATP-binding protein AlbC)) не являются гомолочными и выполняют различные функции: перенос железо-серных кластеров и выработка бактериоцина субтилозина соответственно.
Таблица 3
Protein Name 1 | Protein Name 2 | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels |
---|---|---|---|---|---|---|---|---|
Iron-binding protein IscA | Putative ABC transporter ATP-binding protein AlbC | ISCA_ECOLI | ALBC_BACSU | 13 | 6.7% | 9.8% | 224 | 5 |
Из результатов глобального парного выравнивания можно сделать вывод, что белки действитеотно не гомологичны, так имеют низкие показатели идентичночти и схожести(меньше 10%). Вес выравнивая всего 13.
Таблица 4
Protein Name 1 | Protein Name 2 | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
---|---|---|---|---|---|---|---|---|---|---|
Iron-binding protein IscA | Putative ABC transporter ATP-binding protein AlbC | ISCA_ECOLI | ALBC_BACSU | 32 | 29.0% | 40.3% | 11 | 3 | 55.1% | 21.8% |
Показатели, полученные в результате локального выравнивания выше, чем результаты глобального, за счет выравнивания лишь частей последовательности. Схожесть выравнивания достаточно высокая(40.3%), однако вес выравнивая все равно очень низкий(32).
Выбранная мнемоника ARAB_* обозначающает белки-рибулкиназы, отвечающие за каталитическую активность. Всего по поску (id:ARAB_*) в базе UniProtKB было найдено 77 белков. С помощью кода infoseq 'sw:arab_*' -only -name -nohead -out human.txt в kodomo было найдено всего 75 белков. ЭТО СВЯЗАНО С ТЕМ, ЧТО ...
Из этих белков были выбраны 5 наиболее аннотированных:
ARAB_ECOLI - Escherichia coli (strain K12)
ARAB_BACSU - Bacillus subtilis (strain 168)
ARAB_SALTY - Salmonella typhimurium (strain LT2 / SGSC1412 / ATCC 700720)
ARAB_YERPE - Yersinia pestis
ARAB_ENT38 - Enterobacter sp. (strain 638)
ARAB_ECOHS - Escherichia coli O9:H4 (strain HS)
ARAB_SALG2 - Salmonella gallinarum (strain 287/91 / NCTC 13346)
Две последовательности принадлежат бактериям одного рода Salmonella, но разных видов. Было интересно узнать, насколько расходятся гомолочные белки между разными видами. Две последовательновательности принадлежат бактерии Escherichia coli из разных штаммов, однако даже такие последовательности имеют расхождения.
Для выполнения этого задания использовалась программа EMBOSS muscle. Был создан txt файл с ID белков, который затем был переведен в формат fasta с помощью команды seqret, после чего был запущен muscle. Полученное выравнивание было импортированно в Jalview, где колонки были раскрашены по цвету идентичности.
Из результатов выравнивания можно сделать вывод, что белки гомологичны. Однако белок ARAB_BACSU является наиболее отличным от остальных: это видно на участках 12, 40-51, 80-83. ГОмологичность белков основывается на том, что в выравнивании присутствует выраженная структура: достаточно много консервативных блоков. Например, 13-15, 85-86, 87-89, 94-97, 130-133, 164-168.