Для того чтобы провести серию глобальных выравниваний, я отобрала пары последовательностей с одинаковой мнемоникой у кишечной и сенной палочек с помощью возможностей гугл-таблиц. Далее с помощью программы needle я выровняла последовательности и получила следующие результаты:
| Protein Name | ID 1 | ID 2 | Score | Identity | Similarity | Gaps | Indels |
|---|---|---|---|---|---|---|---|
| Putative aliphatic sulfonates transport permease protein SsuC | SSUC_ECOLI | SSUC_BACSU | 609.5 | 43.0% | 61.3% | 29 | 4 |
| D-methionine transport system permease protein MetI | METI_ECOLI | METI_BACSU | 20.0 | 4.9% | 8.6% | 436 | 10 |
| ATP synthase subunit a | ATP6_ECOLI | ATP6_BACSU | 260.0 | 27.6% | 45.8% | 79 | 13 |
Таблица 1. Характеристики глобального парного выравнивания трёх пар белков
Затем для тех же пар трёх белков с помощью программы water была проведена серия локальных выравниваний и получены следующие результаты:
| Protein Name | ID 1 | ID 2 | Score | Identity | Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
|---|---|---|---|---|---|---|---|---|---|
| Putative aliphatic sulfonates transport permease protein SsuC | SSUC_ECOLI | SSUC_BACSU | 617.0 | 49.2% | 69.6% | 0 | 0 | 91.3% | 86.9% |
| D-methionine transport system permease protein MetI | METI_ECOLI | METI_BACSU | 35.0 | 53.8% | 92.3% | 1 | 1 | 5.9% | 3.2% |
| ATP synthase subunit a | ATP6_ECOLI | ATP6_BACSU | 265.0 | 29.8% | 50.0% | 53 | 11 | 85.6% | 94.7% |
Таблица 2. Характеристики локального парного выравнивания трёх пар белков
Данные белки вполне можно назвать гомологичными, так как при глобальном выравнивании показатели идентичности и сходства оказались достаточно большими, и количество инделей и гэпов тоже в рамках допустимого для того чтобы выдвинуть предположение о гомологии. Локальное выравнивание в данном случае информативно, но по факту не даёт так много информации, как глобальное.
Гомология очень маловероятна, потому что показатели идентичности и сходства очень низкие, а также достаточно много гэпов и инделей. Вероятнее всего, программа в попытке выровнять последовательности по всей длине просто растягивает последовательности за счёт добавления большого количества гэпов и инделей. Однако у данной пары белков почти наверняка есть гомологичные участки, так как показатели идентичности, а тем более сходства, очень высокие, а инделей и гэпов очень мало. Но этот участок довольно маленький, так как покрывает менее 6% у обеих последовательностей. Локальное выравнивание в данном случае информативно, потому что именно благодаря ему удаётся обнаружить гомологию. Пары букв, сопоставленные в локальном выравнивании, не сопоставлены корректно в глобальном, потому что глобальный алгоритм вынужден выравнивать последовательности по всей длине и вставляет огромное число гэпов, тем самым разрывая консервативный участок.
Гомология под сомнением. Показатели идентичности и сходства средние, но ближе к гомологичным, поэтому предположить гомологию можно, но вероятно эти последовательности — довольно дальние гомологи, и для большей уверенности необходим дополнительный анализ. Гомологичные участки наверняка есть, так как полученные при локальном выравнивании участки достаточно схожи и составляют большую долю в обеих последовательностях. В данном случае локальное выравнивание информативно, но менее информативно, чем в двух предыдущих, так как по большей части повторяет глобальное.
Для проверки были взяты заведомо неродственные белки: Medium/long-chain acyl-CoA thioesterase YigI (YIGI_ECOLI) и DNA-3-methyladenine glycosylase (3MGA_BACSU).
| Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels |
|---|---|---|---|---|---|---|---|
| 1) Medium/long-chain acyl-CoA thioesterase YigI 2) DNA-3-methyladenine glycosylase |
YIGI_ECOLI | 3MGA_BACSU | 18.5 | 3.4% | 8.1% | 312 | 4 |
Таблица 3. Характеристики глобального парного выравнивания неродственной пары белков
| Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
|---|---|---|---|---|---|---|---|---|---|
| 1) Medium/long-chain acyl-CoA thioesterase YigI 2) DNA-3-methyladenine glycosylase |
YIGI_ECOLI | 3MGA_BACSU | 26.5 | 20.8% | 41.7% | 8 | 1 | 30.9% | 13.2% |
Таблица 4. Характеристики локального парного выравнивания неродственной пары белков
В данном случае белки, как можно было предположить, имеют низкие показатели как в глобальном, так и в локальном выравнивании. Из чего можно вполне уверенно заявить об их негомологичности. Это согласуется с тем, что данные последовательности выбирались случайным образом.
Для множественного выравнивания я выбрала мнемонику ATP6 (ATP synthase subunit a). С помощью расширенного поиска в UniProtKB я нашла другие записи с такой же мнемоникой в базе Swiss-Prot.
Запрос: (id:ATP6_*) AND (reviewed:true)
По данному запросу было найдено 604 белка, из которых были выбраны следующие пять: ATP6_HUMAN, ATP6_BOVIN, ATP6_DROME, ATP6_YEAST, ATP6_YARLI. Затем в Jalview с помощью программы Mafft было выполнено множественное выравнивание.
Уровень консервативности полученного выравнивания — средний. В нём присутствуют довольно консервативные участки, например: 141–149, 198–241, 283–294. Тем не менее, на мой взгляд, не все последовательности выровнялись хорошо. Так, последовательности ECOLI, BACSU и DROME выровнялись хуже остальных. Несмотря на это, я считаю, что все белки в данном выравнивании являются гомологами, хотя, возможно, и не самыми близкими.