Практикум 9

Задание 1. Глобальное парное выравнивание гомологичных белков

При помощи команды infoseq в bash были скачаны идентификаторы записей, которые заканчиваются на _ECOLI или _BACSU (То есть принадлежащие штамму K12 кишечной палочки или штамму 168 сенной палочки)

Далее был использован конвейер (cut -f 1 -d '_' ecoli.txt bacsu.txt | sort | uniq -d > common_mnems.txt). Таким образом мы получили одинаковые мнемоники для двух штаммов. Далее я выбрала мнемоники , которые мне понравились (AGAL, AYPC и AK3) и провела для них глобальное парное выравнивание командой needle

Выравнивание выполнено при помощи программы needle

Таблица 1. Характеристики глобального парного выравнивания трёх пар белков

Protein Name ID1 ID2 Score % Identity % Similarity Gaps Indels
Alpha-Galactosidase AGAL_ECOLI AGAL_BACSU 1066.0 48.6% 63.9% 19 5
Alkyl hydroperoxide reductase C AHPC_ECOLI AHPC_BACSU 688.0 65.2% 82.4% 0 0
Lysine-sensitive aspartokinase 3 AK3_ECOLI AK3_BACSU 358.5 26.7% 43.6% 65 16

Задание 2. Локальное парное выравнивание гомологичных белков

Выполнено при помощи программы water

Таблица 2. Характеристики локального парного выравнивания трёх пар белков

Protein Name ID1 ID2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
Alpha-Galactosidase AGAL_ECOLI AGAL_BACSU 1070.0 49.7% 65.1% 14 4 97.78% 98.84%
Alkyl hydroperoxide reductase C AHPC_ECOLI AHPC_BACSU 688.0 65.2% 82.4% 0 0 100% 100%
Lysine-sensitive aspartokinase 3 AK3_ECOLI AK3_BACSU 360.5 27.3% 44.4% 57 16 98.66% 98.23%

Коментарии к выравниваниям

AGAL_ECOLI и AGAL_BACSU

Глобальное и локальное выравнивания имеют схожие результаты. Характеристики локального выравнивания незначительно лучше чем у глобального. Из чего я могу сделать вывод, что данные белки гомологичны по всей длине.

AHPC_ECOLI и AHPC_BACSU

Глобальное и локальное выравнивание дали абсолютно идентичные результаты: идентичность 65.2%, схожесть 82.4%, что считается высокими показателями. А также в выраваниваниях отсуствуют индели и процент покрытия белков равен 100%. В итоге можно сказать, что данные белки гомологичныпо всей длине.

AK3_ECOLI и AK3_BACSU

Глобальное и локальное выраванивания имеют схожие показателями: в локальном выравнивании всего на два инделя меньше чем в глобальном. Вес выраванивания, идентичность и схожесть также отличаются незначительно. Однако вес, схожесть и идентичность значительно ниже чем в двух прошлых выравниваниях. ОДнако присутствует достаточно много гэпов (65 для глобального и 57 для локального). Можно сделать вывод, что данные белки могут быть гомологичными, но их последовательости более вариабельные чем в двух предыдущих выравниваниях./p>

Задание 3. Результат применения программ к неродственным белкам

Таблица 3. Характеристики глобального парного выравнивания негомологичных белков

Protein Name 1 Protein Name 2 ID1 ID2 Score % Identity % Similarity Gaps Indels
Alpha-Galactosidase Alkyl hydroperoxide reductase C AGAL_ECOLI AHPC_BACSU 24.0 5.7% 9.7% 414 7

Таблица 4. Характеристики локального парного выравнивания негомологичных белков

Protein Name 1 Protein Name 2 ID1 ID2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
Alpha-Galactosidase Alkyl hydroperoxide reductase C AGAL_ECOLI AHPC_BACSU 46.0 22.7% 43.9% 10 2 12.41% 35.29%

Данные выравнивания имеют маленький вес, но при этом имеют очень много гэпов. Интересно заметить, что в локальном выравнивании были получены относительно высокие значения схожести и идентичности, однако учитывая насколько мало покрытие белка, можно сделать вывод, что это случайное совпадение. В итоге по данным выравниваниям можно сделать вывод, что белки негомологичны.

Задание 4. Множественное выравнивание белков и импорт в Jalview

Для множественного выравнивания я выбрала белок с мнемоникой AGAL_. Был произведен поиск в базе Uniprot

Запрс выглядел вот так: *_AGAL. Далее при помощи расширенного поиска в боковой панели были выбраны белки из Swiss-Prot.

В Swiss-Prot нашлось 29 белков

Данная мнемоника соотвествует белку Alpha-Galactosidase

Было выбрано белков:

Для множественного выравнивания использовалась команда muscle в терминале. Для визуализации результат был загружен в Jalview.

тут про качество надо потом написать

В выравнивании видно, что наблюдаются участки со схожими аминокислотами, однако присутствует очень много гэпов, следовательно данное выравнивание я считаю удовлетворительным по качеству. Белки же вероятно гомологичны, однако обладают высокой вариабильностью. Еще можно отметить, что сильнее всего схожи белки человека и мыши.

Ссылка на проект Jalview