1. Программа для подсчёта инделей
Программа indels.py анализирует результаты глобального или локального выравнивания двух последовательностей, выполненных с помощью needle или water соответственно.
Результат работы программы - вывод количества инделей в каждой из последовательной и суммарное количество.
2. Глобальное парное выравнивание гомологичных белков
Выравнивание получено с помощью needle с параметрами по умолчанию.
| Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels |
|---|---|---|---|---|---|---|---|
| Acetate kinase | ACKA_ECOLI | ACKA_BACSU | 821.0 | 43.0 | 63.6 | 23 | 11 |
| Allantoinase | ALLB_ECOLI | ALLB_BACSU | 776.0 | 35.9 | 54.9 | 27 | 8 |
| ATP synthase subunit alpha | ATPA_ECOLI | ATPA_BACSU | 1417.0 | 54.0 | 72.0 | 15 | 3 |
3. Локальное парное выравнивание гомологичных белков
Выравнивание получено с помощью water с параметрами по умолчанию.
| Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
|---|---|---|---|---|---|---|---|---|---|
| Acetate kinase | ACKA_ECOLI | ACKA_BACSU | 823.5 | 43.3 | 64.2 | 21 | 11 | 98.25% | 98.73% |
| Allantoinase | ALLB_ECOLI | ALLB_BACSU | 779.0 | 36.8 | 56.8 | 12 | 6 | 95.81% | 96.41% |
| ATP synthase subunit alpha | ATPA_ECOLI | ATPA_BACSU | 1423.0 | 54.5 | 72.5 | 13 | 2 | 99.42% | 99.00% |
4. Комментарии к выравниваниям
4.1. Пара ACKA
Процент идентичнсоти больше или равен 43, из чего можно сделать вывод, что белки гомологичны.
Локальное выравнивание дает практически такие же результаты, как и глобальное: идентичность выше на 0.4%, сходство (similarity) - на 0.6%, при этом гэпов меньше на 2. В целом можно сказать, что оба метода одинаково информативны.
4.2. Пара ALLB
Степень идентичнсоти несколько больше 35%, а схожести - 54.9%(в глобальном выравнивании; а в локальном - 56.8%), значит, скорее всего, белки гомологичны.
В данном случае в локальном выравнивании значительно меньше гэпов (12 вместо 27 в глоабльном выравнивании), при этом и степень схожести, и степень идентичности немного выше, чем в глоабльном. Таким образом, оба метода выравнивания информативны, может быть, локальное более информативно, чем глобальное.
4.3. Пара ATPA
Результаты глобального и локального выравниваний очень близки друг к другу. Степеень идентичности выше 54%, что говорит о достаточно высокой степени гомологии белков.
Данная пара имеет самые высокие показатели "покрытия" при локальном выравнивании: более или 99%.
Оба метода информативны примерно одинаково.
5. Результат применения программ выравнивания к неродственным белкам
Выбранная пара белков: BACF_BACSU (Transaminase BacF) и AQPZ_ECOLI (Aquaporin Z).
5.1. Результаты глобального выравнивания
| Score | % Identity | % Similarity | Gaps |
|---|---|---|---|
| 23.5 | 13.6 | 21.1 | 252/441 (57.1%) |
5.2. Результаты локального выравнивания
| Score | % Identity | % Similarity | Gaps |
|---|---|---|---|
| 45.0 | 20.9 | 32.1 | 68/187 (36.4%) |
Белки не являются гомологичными, так как имеют низкий процент идентичности (13.6% и 20.9% для глобального и локального выравнивания соответственно). Кроме того, в случае глобального выравнивания
очень много гэпов (более 50%), хотя в обоих результатах (5.1; 5.2) процент гэпов на порядок выше, чем в любом представленном выше выравнивании пар гомологичных белков.
В целом, не выявлено значимого гомологичного сходства между выбранными последовательностями.
6. Множественное выравнивание белков
Выбранная мнемоника: ACKA; рекомендованное полное имя белка из ECOLI: Acetate kinase
По запросу id:ACKA* AND reviewed:true найдено 347 результатов.
Из них были выбраны 7 белков:
Все семь последовательностей были объединены в один файл в формате FASTA (файл acka.fasta).
Множественное выравнивание было получено с помощью команды:
muscle -align acka.fasta -output acka_alignment.fasta
Данное выравнивание было загружено в программу Jalview; в которой была выполнена раскраска колонок по степени (проценту) идентичности.
Ссылка на файл с проектом выравнивания acka_align_project.jvp
Все семь последовательностей хорошо выровнялись, белки гомологичны (все семь являются ацетат киназами.
Есть множество консервативных участков: наиболее консервативные, например, столбцы 155-185, 216-223.