Укоренение и бутстрэп






Следите за обновлениями и дополнениями
Если Вы заметили опечатки, или ссылка испортилась, пожалуйста, напишите мне



Построение и анализ дерева, содержащего паралоги

При выполнении практикума был проведён поиск гомологов белка CLPX_ECOLI - АТФ-зависимой Clp протеазы. Родственные белки искались в протеомах бактерий, отобранных в предыдущем практикуме (Представлены в таблице 1 с указанием мнемоники).


Таблица 1. Организмы
Организм: название
Мнемоника
Rhizobium etli
RHIEC
Rhodobacter sphaeroides
RHOS4
Neisseria meningitidis
NEIMA
Escherichia coli
ECOLI
Yersinia pestis
YERPE
Haemophilus influenzae
HAEIN
Proteus mirabilis
PROMH


Поиск гомологов осуществлялся с помощью локальной версии программы Blastp.

Для создания словаря использовалась команда:
makeblastdb -in PROTEOMES.fasta -dbtype prot

Для поиска по словам с E-value 0.001 использовалась команда:
blastp -query P0A6H1.fasta -db PROTEOMES.fasta -evalue 0.001 -outfmt 7

В результате анализа было найдено 31 неидентичных гомологичных последовательности. Результаты были записаны в файл out.txt

С помощью скрипта script.sh на bash последовательности были извлечены из файла PROTEOMES.fasta

Все последовательности были собраны в один файл командой
cat *_*.fasta >> alignment.fasta

Последовательности были выровнены с помощью программы emma из пакета EMBOSS.
Команда: emma alignment.fasta

Дерево последовательностей было реконструировано в MEGA 7 с помощью метода Maximum Likelihood, а также был визуализирован вариант дерева, реконструируемого самой программой emma.
Команда: fdrawgram -intreefile den-emma.dnd -plotfile den_plot.fdrawtree -auto


Изображения, полученные разными программами совпадал. Было решено остановиться на Mega 7.

Рисунок 1. Исходное филогенетическое дерево, построенное в Mega 7.

Рисунок 2. Консенсусное филогенетическое дерево, построенное в Mega 7.



На дереве можно обнаружить как ортологичные, так и паралогичные последовательности. Синим выделены все последние акты дивергенции белков на два белка в одном организме - паралоги. Жёлтым и красным градиентом отмечеты две крупные ортологические группы HSLV и CLPX.

Ссылки

  1. Mega 7
  2. Uniprot
  3. Blast