-

Выдача BLAST:

Я воспользовалась командой blastp -db proteomes -query POA6H1.fasta -evalue 0.001 -out out.fasta

Содержание полученного файла:

Query= sp|P0A6H1|CLPX_ECOLI ATP-dependent Clp protease ATP-binding subunit ClpX OS=Escherichia coli (strain K12) OX=83333 GN=clpX PE=1 SV=2
Length=424

Sequences producing significant alignments: Score, (Bits) E-Value
sp|A8GAR0|CLPX_SERP5 ATP-dependent Clp protease ATP-binding subun... 806 0.0
sp|Q8ZC66|CLPX_YERPE ATP-dependent Clp protease ATP-binding subun... 805 0.0
sp|B4EU54|CLPX_PROMH ATP-dependent Clp protease ATP-binding subun... 769 0.0
sp|Q5P160|CLPX_AROAE ATP-dependent Clp protease ATP-binding subun... 619 0.0
sp|Q62JK8|CLPX_BURMA ATP-dependent Clp protease ATP-binding subun... 617 0.0
sp|P57981|CLPX_PASMU ATP-dependent Clp protease ATP-binding subun... 612 0.0
sp|Q8UFY5|CLPX_AGRFC ATP-dependent Clp protease ATP-binding subun... 596 0.0
sp|Q9JTX8|CLPX_NEIMA ATP-dependent Clp protease ATP-binding subun... 557 0.0
sp|A8GL96|HSLU_SERP5 ATP-dependent protease ATPase subunit HslU O... 96.7 9e-22
sp|B4F171|HSLU_PROMH ATP-dependent protease ATPase subunit HslU O... 96.7 9e-22
sp|Q8ZJJ5|HSLU_YERPE ATP-dependent protease ATPase subunit HslU O... 95.1 2e-21
sp|Q5P503|HSLU_AROAE ATP-dependent protease ATPase subunit HslU O... 93.6 9e-21
sp|P57968|HSLU_PASMU ATP-dependent protease ATPase subunit HslU O... 93.2 1e-20
sp|Q8UJ87|HSLU_AGRFC ATP-dependent protease ATPase subunit HslU O... 92.0 2e-20
sp|Q62F00|HSLU_BURMA ATP-dependent protease ATPase subunit HslU O... 82.4 5e-17
tr|A8GCD8|A8GCD8_SERP5 ATP-dependent Clp protease, ATP-binding su... 51.6 5e-07
tr|A0A5P8YGZ0|A0A5P8YGZ0_YERPE ATP-dependent Clp protease ATP-bin... 51.2 6e-07
tr|B4EV83|B4EV83_PROMH ATP-dependent Clp protease ATP-binding sub... 50.1 1e-06
tr|B4F2B3|B4F2B3_PROMH ATP-dependent zinc metalloprotease FtsH OS... 46.6 2e-05
tr|A8G901|A8G901_SERP5 ATP-dependent zinc metalloprotease FtsH OS... 46.2 2e-05
tr|A0A5P8YB42|A0A5P8YB42_YERPE ATP-dependent protease OS=Yersinia... 46.2 2e-05
tr|A0A5P8YCE6|A0A5P8YCE6_YERPE ATP-dependent zinc metalloprotease... 45.8 3e-05
tr|Q7CT50|Q7CT50_AGRFC ATP-dependent zinc metalloprotease FtsH OS... 45.4 4e-05
tr|A0A0H2WJ72|A0A0H2WJ72_BURMA ATP-dependent zinc metalloprotease... 43.9 1e-04
tr|Q9CNJ2|Q9CNJ2_PASMU ATP-dependent zinc metalloprotease FtsH OS... 43.1 2e-04
sp|Q9JUB0|RUVB_NEIMA Holliday junction branch migration complex s... 42.7 2e-04
tr|Q9CKU5|Q9CKU5_PASMU ComM OS=Pasteurella multocida (strain Pm70... 41.6 6e-04
tr|A0A0U1RJ22|A0A0U1RJ22_NEIMA Replication-associated recombinati... 40.8 0.001

Составила файл с последовательностями. К сожалению, некоторые (6 последовательностей) не удалось найти ни с помощью seqret, ни вручную - они не представлены в файле.

По этим последовательностям построила дерево с этой newick репрезентацией.

Пары паралогов:

CLPX_PASMU и Q9CNJ2_PASMU, CLPX_NEIMA и RUVB_NEIMA, Q9CKU5_PASMU и Q9CNJ2_PASMU.

Пары ортологов:

CAR46686-1 и Q9CNJ2_PASMU, HSLU AGRFC и CAR41610-1, RUVB NEIMA и Q7CT50 AGRT5.

Изображения древа:

Изображение укорененного древа.

Укоренение в среднюю точку, покрасила достоверные по бутстрепу ветви в свой цвет: получилось три ортологические группы (достоверно) - красная, синяя и желтая. В синей представлены все 8 белков CLPX изучаемых мной бактерий и один из E. coli. В желтой всего 4 белка, они все принадлежат разным организмам. В красной ветви всего 7 белков, не хватает HSLU_NEIMA, я полагаю, это одна из моих "потерянных" последовательностей. Вероятно, в желтой группе их тоже должно быть восемь, но некоторые были хуже аннотированы, поэтому ветвь не так красиво выстроилась. Очень приятно, что внутри синей ветви филогения повторяет древо из прошлого практимума - эволюция шла ровно.

Изображение укорененного древа со схлопнутыми ортологическими группами.

Схлопнула выделенные выше ортологические группы.

Схлопнутая по бутстрепу ветвь.

Пробовала собирать ветви в зависимости от порога бутстреповской поддержки, при пороге от 100 до 27 он дает две большие ветви - красную с сестрами против желтой с синей. При поддержке 27 он просто собирает красную ветвь с ее сестринской группой (см. рис.).