При помощи команды infoseq в bash были скачаны идентификаторы записей, которые заканчиваются на _ECOLI или _BACSU (То есть принадлежащие штамму K12 кишечной палочки или штамму 168 сенной палочки)
Далее был использован конвейер (cut -f 1 -d '_' ecoli.txt bacsu.txt | sort | uniq -d > common_mnems.txt). Таким образом мы получили одинаковые мнемоники для двух штаммов. Далее я выбрала мнемоники , которые мне понравились (AGAL, AYPC и AK3) и провела для них глобальное парное выравнивание командой needle
Выравнивание выполнено при помощи программы needle
Таблица 1. Характеристики глобального парного выравнивания трёх пар белков
| Protein Name | ID1 | ID2 | Score | % Identity | % Similarity | Gaps | Indels |
|---|---|---|---|---|---|---|---|
| Alpha-Galactosidase | AGAL_ECOLI | AGAL_BACSU | 1066.0 | 48.6% | 63.9% | 19 | 5 |
| Alkyl hydroperoxide reductase C | AHPC_ECOLI | AHPC_BACSU | 688.0 | 65.2% | 82.4% | 0 | 0 |
| Lysine-sensitive aspartokinase 3 | AK3_ECOLI | AK3_BACSU | 358.5 | 26.7% | 43.6% | 65 | 16 |
Выполнено при помощи программы water
Таблица 2. Характеристики локального парного выравнивания трёх пар белков
| Protein Name | ID1 | ID2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
|---|---|---|---|---|---|---|---|---|---|
| Alpha-Galactosidase | AGAL_ECOLI | AGAL_BACSU | 1070.0 | 49.7% | 65.1% | 14 | 4 | 97.78% | 98.84% |
| Alkyl hydroperoxide reductase C | AHPC_ECOLI | AHPC_BACSU | 688.0 | 65.2% | 82.4% | 0 | 0 | 100% | 100% |
| Lysine-sensitive aspartokinase 3 | AK3_ECOLI | AK3_BACSU | 360.5 | 27.3% | 44.4% | 57 | 16 | 98.66% | 98.23% |
Глобальное и локальное выравнивания имеют схожие результаты. Характеристики локального выравнивания незначительно лучше чем у глобального. Из чего я могу сделать вывод, что данные белки гомологичны по всей длине.
Глобальное и локальное выравнивание дали абсолютно идентичные результаты: идентичность 65.2%, схожесть 82.4%, что считается высокими показателями. А также в выраваниваниях отсуствуют индели и процент покрытия белков равен 100%. В итоге можно сказать, что данные белки гомологичныпо всей длине.
Глобальное и локальное выраванивания имеют схожие показателями: в локальном выравнивании всего на два инделя меньше чем в глобальном. Вес выраванивания, идентичность и схожесть также отличаются незначительно. Однако вес, схожесть и идентичность значительно ниже чем в двух прошлых выравниваниях. ОДнако присутствует достаточно много гэпов (65 для глобального и 57 для локального). Можно сделать вывод, что данные белки могут быть гомологичными, но их последовательости более вариабельные чем в двух предыдущих выравниваниях./p>
Таблица 3. Характеристики глобального парного выравнивания негомологичных белков
| Protein Name 1 | Protein Name 2 | ID1 | ID2 | Score | % Identity | % Similarity | Gaps | Indels |
|---|---|---|---|---|---|---|---|---|
| Alpha-Galactosidase | Alkyl hydroperoxide reductase C | AGAL_ECOLI | AHPC_BACSU | 24.0 | 5.7% | 9.7% | 414 | 7 |
Таблица 4. Характеристики локального парного выравнивания негомологичных белков
| Protein Name 1 | Protein Name 2 | ID1 | ID2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
|---|---|---|---|---|---|---|---|---|---|---|
| Alpha-Galactosidase | Alkyl hydroperoxide reductase C | AGAL_ECOLI | AHPC_BACSU | 46.0 | 22.7% | 43.9% | 10 | 2 | 12.41% | 35.29% |
Данные выравнивания имеют маленький вес, но при этом имеют очень много гэпов. Интересно заметить, что в локальном выравнивании были получены относительно высокие значения схожести и идентичности, однако учитывая насколько мало покрытие белка, можно сделать вывод, что это случайное совпадение. В итоге по данным выравниваниям можно сделать вывод, что белки негомологичны.
Для множественного выравнивания я выбрала белок с мнемоникой AGAL_. Был произведен поиск в базе Uniprot
Запрс выглядел вот так: *_AGAL. Далее при помощи расширенного поиска в боковой панели были выбраны белки из Swiss-Prot.
В Swiss-Prot нашлось 29 белков
Данная мнемоника соотвествует белку Alpha-Galactosidase
Было выбрано белков:
Для множественного выравнивания использовалась команда muscle в терминале. Для визуализации результат был загружен в Jalview.
тут про качество надо потом написать
В выравнивании видно, что наблюдаются участки со схожими аминокислотами, однако присутствует очень много гэпов, следовательно данное выравнивание я считаю удовлетворительным по качеству. Белки же вероятно гомологичны, однако обладают высокой вариабильностью. Еще можно отметить, что сильнее всего схожи белки человека и мыши.
Ссылка на проект Jalview