С помощью SRS в БД UniProt были найдены аминокислотные последовательности для следующей выборки:
В выборку из разных штаммов одного вида бактерий был выбран один штамм, последовательности длиной менее 200 а.о. в выборку включены не были.
Перечень названий организвом, включённых в выборку - taxon_names.txt
Перечень аминокислотных последовательностей для них - seq.txt
По полученным данным было построено дерево методом Neighbour-Joining. Жирным выделены представители outgroup`ы. Красным выделены представители ветви и вершины, соответствующие архейным белкам. Все остальные цвета - для ортологов и паралогов (см. ниже).
С помощью ресурсов сайта NCBI было построено таксономическое дерево.
Все деревья выполнены в формате "gdt", и открываются программой GeneMaster.
Так же деревья представлены в графическом формате:
дерево, таксономическое дерево.
По неизвестным причинам при копировании с сайта NCBI скобочной формулы из описанного на NCBI дерева пропадают два организма из архей: Sulfolobus acidocaldarius и Sulfolobus solfataricus. По этой причине таксономическое дерево содержит четыре из шести организмов из архей.
Паралоги - это последовательности, возникшие из одного общего предшественника в результате дупликации одного гена в одном организме. Паралоги, как правило, имеют разныефункции.
Ортологи - это последовательности, возникшие из одного общего прешевственника в процессе видообразования. Ортологи, как правило, имеют одну и ту же функцию.
Были выявлены следующие пары:
© Трушкин Никита,2006