Практикум 9. Выравнивания

1. Программа для подсчёта инделей

Программа indels.py анализирует результаты глобального или локального выравнивания двух последовательностей, выполненных с помощью needle или water соответственно.
Результат работы программы - вывод количества инделей в каждой из последовательной и суммарное количество.

2. Глобальное парное выравнивание гомологичных белков

Выравнивание получено с помощью needle с параметрами по умолчанию.

Protein NameID 1ID 2Score% Identity% SimilarityGapsIndels
Acetate kinaseACKA_ECOLIACKA_BACSU821.043.063.62311
AllantoinaseALLB_ECOLIALLB_BACSU776.035.954.9278
ATP synthase subunit alphaATPA_ECOLIATPA_BACSU1417.054.072.0153

3. Локальное парное выравнивание гомологичных белков

Выравнивание получено с помощью water с параметрами по умолчанию.

Protein NameID 1ID 2Score% Identity% SimilarityGapsIndelsCoverage 1Coverage 2
Acetate kinaseACKA_ECOLIACKA_BACSU823.543.364.2211198.25%98.73%
AllantoinaseALLB_ECOLIALLB_BACSU779.036.856.812695.81%96.41%
ATP synthase subunit alphaATPA_ECOLIATPA_BACSU1423.054.572.513299.42%99.00%

4. Комментарии к выравниваниям

4.1. Пара ACKA

Процент идентичнсоти больше или равен 43, из чего можно сделать вывод, что белки гомологичны.

Локальное выравнивание дает практически такие же результаты, как и глобальное: идентичность выше на 0.4%, сходство (similarity) - на 0.6%, при этом гэпов меньше на 2. В целом можно сказать, что оба метода одинаково информативны.

4.2. Пара ALLB

Степень идентичнсоти несколько больше 35%, а схожести - 54.9%(в глобальном выравнивании; а в локальном - 56.8%), значит, скорее всего, белки гомологичны.

В данном случае в локальном выравнивании значительно меньше гэпов (12 вместо 27 в глоабльном выравнивании), при этом и степень схожести, и степень идентичности немного выше, чем в глоабльном. Таким образом, оба метода выравнивания информативны, может быть, локальное более информативно, чем глобальное.

4.3. Пара ATPA

Результаты глобального и локального выравниваний очень близки друг к другу. Степеень идентичности выше 54%, что говорит о достаточно высокой степени гомологии белков.

Данная пара имеет самые высокие показатели "покрытия" при локальном выравнивании: более или 99%.
Оба метода информативны примерно одинаково.

5. Результат применения программ выравнивания к неродственным белкам

Выбранная пара белков: BACF_BACSU (Transaminase BacF) и AQPZ_ECOLI (Aquaporin Z).

5.1. Результаты глобального выравнивания

Score% Identity% SimilarityGaps
23.513.621.1 252/441 (57.1%)

5.2. Результаты локального выравнивания

Score% Identity% SimilarityGaps
45.020.932.168/187 (36.4%)

Белки не являются гомологичными, так как имеют низкий процент идентичности (13.6% и 20.9% для глобального и локального выравнивания соответственно). Кроме того, в случае глобального выравнивания очень много гэпов (более 50%), хотя в обоих результатах (5.1; 5.2) процент гэпов на порядок выше, чем в любом представленном выше выравнивании пар гомологичных белков.
В целом, не выявлено значимого гомологичного сходства между выбранными последовательностями.

6. Множественное выравнивание белков

Выбранная мнемоника: ACKA; рекомендованное полное имя белка из ECOLI: Acetate kinase

По запросу id:ACKA* AND reviewed:true найдено 347 результатов.
Из них были выбраны 7 белков:

Все семь последовательностей были объединены в один файл в формате FASTA (файл acka.fasta).
Множественное выравнивание было получено с помощью команды:

muscle -align acka.fasta -output acka_alignment.fasta

Данное выравнивание было загружено в программу Jalview; в которой была выполнена раскраска колонок по степени (проценту) идентичности.

Ссылка на файл с проектом выравнивания acka_align_project.jvp

Все семь последовательностей хорошо выровнялись, белки гомологичны (все семь являются ацетат киназами.
Есть множество консервативных участков: наиболее консервативные, например, столбцы 155-185, 216-223.