Для выполнения рактикума были отобраны протеомы бактерий из директории /P/y22/term4/Proteomes: NEIMA, PROMH, ROSDO, RHIME, YERPE, THIDA, ECOLI.
cat NEIMA.fasta PROMH.fasta ROSDO.fasta RHIME.fasta YERPE.fasta THIDA.fasta ECOLI.fasta > ~/term4/pr4/prot.fasta
На основе выбранных протеомов была создана локальная база данных:
makeblastdb -dbtype prot -in prot.fasta -out org
Был запущен blastp, в качестве запроса была подана последовательность белка с мнемоникой CLPX_ECOLI, порог E-value: 0.0001:
blastp -query CLPX.fasta -db org -evalue 0.0001 -out result.txt
Был получен следующий список находок: Ссылка на файл.
Было изменено название находок на их мнемоники, затем выравнивание методом muscle. Дерево было построено программой fastme, в качестве модели была взята MtREV, также была использована бутстреп-поддержка (100 реплик). Визуализация дерева программой iTOL - дерево укоренено в среднюю точку.
На Рис. 3. показаны различные ортологические группы, таких выделилось 3 штуки (CLPX и HSLU, третья группа). Ссылка формулу дерева в формате Newick.
Примеры ортологов: HSLU_PROMH и HSLU_ECOLI, CLPX_ROSDO и CLPX_RHIME, B4F2B3_PROMH и FTSH_ECOLI.
Примеры паралогов: CLPX_ECOLI и HSLU_ECOLI, CLPX_PROMH и HSLU_PROMH, CLPX_YERPE и HSLU_YERPE.
HSLU: Состав: ROSDO, RHIME, ECOLI, YERPE, PROMH.
Cоответствует филогении за исключением организмов PROMH и ECOLI. Они поменялись местами - в соостветсвии с эталонным деревом ECOLI и YERPE должны составлять кладу, отходящую от организма PROMH.
((PROMH)((ECOLI,YERPE))) вместо ((ECOLI)((PROMH,YERPE)))
CLPX: Состав: NEIMA, ROSDO, RHIME, THIDA, ECOLI, YERPE, PROMH.
Cоответствует филогении за исключением организмов NEIMA и RHIME. В соостветсвии с эталонным деревом NEIMA и RHIME должны составлять кладу.
Третья группа: Состав: RHIME, ECOLI, YERPE, PROMH.
Cоответствует филогении (эталонное дерево)