Составление списка гомологичных белков, включающих паралоги

Для получения списка белков-гомологов для CLPX_ECOLI использовалась программа blastp:

  • blastp -query CLPX_ECOLI.fasta -subject /P/y22/term4/Proteomes/ROSDO.fasta -evalue 0.0001 -outfmt 7 >>resultfmt7
  • Использовались 7 протеомов, результат выдачи (полный файл):

    Следующий этап это выделение последовательностей в формате fasta. Из выдачи blastp выбираем белки с наилучшим показателем e-value и выравниваем последовательности (файл|выравнивание):

  • echo 'sw:CLPX_BORPE' 'sw:HSLU_BORPE' 'sw:CLPX_BRUSU' 'sw:HSLU_BRUSU' 'sw:CLPX_ACICJ' 'sw:CLPX_YERPE' 'sw:HSLU_YERPE' 'sw:CLPX_THIDA' 'sw:CLPX_HAEIN' 'sw:HSLU_HAEIN' 'sw:CLPX_ROSDO' 'sw:HSLU_ROSDO' 'sw:RUVB_ROSDO'|tr ' ' '\n'|seqret -filter @stdin -outseq CLPX.fasta
  • muscle -align CLPX.fasta -output CLPX-alignment.fasta
  • Далее формат файла изменили на phylip-relaxed и построили дерево программой iqtree (Newick):

  • iqtree -s CLPX.phy
  • Будем считать дерево реконструированным верно несмотря на подозрительную ветвь RUVB_ROSDO, которая является частью комплекса, учавствующего в разрешении структуры Холлидея. В таком случае оценим наличие паралогов и ортологов:

    Ортологи Паралоги
    (CLPX_BORPE; CLPX_BRUSU) (CLPX_BORPE; HSLU_BORPE)
    (HSLU_BORPE; HSLU_BRUSU) (CLPX_HAEIN; HSLU_HAEIN)
    (HSLU_ROSDO; HSLU_ACICJ) (CLPX_ROSDO; RUVB_ROSDO)
    Описание клад: HSLU представлен HAEIN, YERPE, BORPE, ROSDO, BRUSU; CLPX представлен HAEIN, YERPE, BORPE, ROSDO, BRUSU, THIDA, ACICJ

    Сопоставление с филогенией: HSLU - согласуется с филогенией, CLPX - практически полностью согласуется, BRUSU должно быть ближе с ROSDO нежели с ACICJ