Реконструкция эволюции доменной архитектурыЦель: Реконструировать эволюцию доменной архитектуры белков, содержащих один и тот же домен PfamЗадача 1. Построить выравнивание представителей домена Pfam белков с разной доменной архитектуройДля дальнейшей реконструкции эволюции доменной архитектуры белков был выбран N-концевой домен ГТФ-связывающей ГТФазы (GTP-binding GTPase N-terminal).
Загруженное с помощью JalView выравнивание из Pfam (File > Fetch Sequences по идентификатору PF00134) было раскрашено по консервативности (ClustalX) -> all_aligned.jvp (ссылка на проект Jalview) Выбор архитектур и таксоновДля работы я выбрал следующие две архитектуры, содержащие исследуемый домен:
Далее с помощью скрипта swisspfam_to_xls.py были отобраны последовательности с исследуемым доменом из файла /srv/databases/pfam/swisspfam.gz с информацией об архитектуре всех последовательностей: python swisspfam-to-xls.py -z -i /srv/databases/pfam/swisspfam.gz -p PF13167 -o arc.xls В результате я получил файл arc.xls, после чего сохранил в файл arc_my.txt только свой домен. Сервисом Uniprot я поднял последовательности для моих ID. была получения таксономия с помощью скрипта uniprot_to_taxonomy.py: python uniprot-to-taxonomy.py -i uniprot.txt -o tax.xls В результате был получен файл с таксономией - tax.xls. Я выбрал таксон Ecdysozoa и два его подтаксона: Arthropoda и Nematoda python filter-alignment.py -i align.fasta -m id.txt -o align_selected.fa -a Анализ выравнивания и таксономииДля данных таксонов я посторил выравнивание (Muscle), а также филогенетическое дерево (NJ): ![]() Рис. 1. Выравнивание выбранных последовательностей с разделением на группы по архитектурам ![]() Рис. 2. Дерево, построенное по выравниванию выбранных последовательностей методом NJ По выравниванию видно, что последовательности имеют общее, однако меня такое выравнивание не сильно убеждает. Я все же решил построить дерево, и вот по нему уже видно, что не происходит разделение ни по таксонам, ни по архитектурам.
|