-
Я воспользовалась командой blastp -db proteomes -query POA6H1.fasta -evalue 0.001 -out out.fasta
Содержание полученного файла:
Query= sp|P0A6H1|CLPX_ECOLI ATP-dependent Clp protease ATP-binding subunit
ClpX OS=Escherichia coli (strain K12) OX=83333 GN=clpX PE=1 SV=2
Length=424
Sequences producing significant alignments: | Score, (Bits) | E-Value |
sp|A8GAR0|CLPX_SERP5 ATP-dependent Clp protease ATP-binding subun... | 806 | 0.0 |
sp|Q8ZC66|CLPX_YERPE ATP-dependent Clp protease ATP-binding subun... | 805 | 0.0 |
sp|B4EU54|CLPX_PROMH ATP-dependent Clp protease ATP-binding subun... | 769 | 0.0 |
sp|Q5P160|CLPX_AROAE ATP-dependent Clp protease ATP-binding subun... | 619 | 0.0 |
sp|Q62JK8|CLPX_BURMA ATP-dependent Clp protease ATP-binding subun... | 617 | 0.0 |
sp|P57981|CLPX_PASMU ATP-dependent Clp protease ATP-binding subun... | 612 | 0.0 |
sp|Q8UFY5|CLPX_AGRFC ATP-dependent Clp protease ATP-binding subun... | 596 | 0.0 |
sp|Q9JTX8|CLPX_NEIMA ATP-dependent Clp protease ATP-binding subun... | 557 | 0.0 |
sp|A8GL96|HSLU_SERP5 ATP-dependent protease ATPase subunit HslU O... | 96.7 | 9e-22 |
sp|B4F171|HSLU_PROMH ATP-dependent protease ATPase subunit HslU O... | 96.7 | 9e-22 |
sp|Q8ZJJ5|HSLU_YERPE ATP-dependent protease ATPase subunit HslU O... | 95.1 | 2e-21 |
sp|Q5P503|HSLU_AROAE ATP-dependent protease ATPase subunit HslU O... | 93.6 | 9e-21 |
sp|P57968|HSLU_PASMU ATP-dependent protease ATPase subunit HslU O... | 93.2 | 1e-20 |
sp|Q8UJ87|HSLU_AGRFC ATP-dependent protease ATPase subunit HslU O... | 92.0 | 2e-20 |
sp|Q62F00|HSLU_BURMA ATP-dependent protease ATPase subunit HslU O... | 82.4 | 5e-17 |
tr|A8GCD8|A8GCD8_SERP5 ATP-dependent Clp protease, ATP-binding su... | 51.6 | 5e-07 |
tr|A0A5P8YGZ0|A0A5P8YGZ0_YERPE ATP-dependent Clp protease ATP-bin... | 51.2 | 6e-07 |
tr|B4EV83|B4EV83_PROMH ATP-dependent Clp protease ATP-binding sub... | 50.1 | 1e-06 |
tr|B4F2B3|B4F2B3_PROMH ATP-dependent zinc metalloprotease FtsH OS... | 46.6 | 2e-05 |
tr|A8G901|A8G901_SERP5 ATP-dependent zinc metalloprotease FtsH OS... | 46.2 | 2e-05 |
tr|A0A5P8YB42|A0A5P8YB42_YERPE ATP-dependent protease OS=Yersinia... | 46.2 | 2e-05 |
tr|A0A5P8YCE6|A0A5P8YCE6_YERPE ATP-dependent zinc metalloprotease... | 45.8 | 3e-05 |
tr|Q7CT50|Q7CT50_AGRFC ATP-dependent zinc metalloprotease FtsH OS... | 45.4 | 4e-05 |
tr|A0A0H2WJ72|A0A0H2WJ72_BURMA ATP-dependent zinc metalloprotease... | 43.9 | 1e-04 |
tr|Q9CNJ2|Q9CNJ2_PASMU ATP-dependent zinc metalloprotease FtsH OS... | 43.1 | 2e-04 |
sp|Q9JUB0|RUVB_NEIMA Holliday junction branch migration complex s... | 42.7 | 2e-04 |
tr|Q9CKU5|Q9CKU5_PASMU ComM OS=Pasteurella multocida (strain Pm70... | 41.6 | 6e-04 |
tr|A0A0U1RJ22|A0A0U1RJ22_NEIMA Replication-associated recombinati... | 40.8 | 0.001 |
Составила файл с последовательностями. К сожалению, некоторые (6 последовательностей) не удалось найти ни с помощью seqret, ни вручную - они не представлены в файле.
По этим последовательностям построила дерево с этой newick репрезентацией.
Пары паралогов:
CLPX_PASMU и Q9CNJ2_PASMU, CLPX_NEIMA и RUVB_NEIMA, Q9CKU5_PASMU и Q9CNJ2_PASMU.
Пары ортологов:
CAR46686-1 и Q9CNJ2_PASMU, HSLU AGRFC и CAR41610-1, RUVB NEIMA и Q7CT50 AGRT5.
Изображения древа:
Укоренение в среднюю точку, покрасила достоверные по бутстрепу ветви в свой цвет: получилось три ортологические группы (достоверно) - красная, синяя и желтая. В синей представлены все 8 белков CLPX изучаемых мной бактерий и один из E. coli. В желтой всего 4 белка, они все принадлежат разным организмам. В красной ветви всего 7 белков, не хватает HSLU_NEIMA, я полагаю, это одна из моих "потерянных" последовательностей. Вероятно, в желтой группе их тоже должно быть восемь, но некоторые были хуже аннотированы, поэтому ветвь не так красиво выстроилась. Очень приятно, что внутри синей ветви филогения повторяет древо из прошлого практимума - эволюция шла ровно.
Схлопнула выделенные выше ортологические группы.