Здание 1

В этом задании необходимо было найти в своих 7 выбранных бактериях достоверные гомологи белка CLPX_ECOLI и построить по ним дерево. Полные протеомы семи бактерий я скопировала из папки /P/y17/term4/Proteomes и объединила в один файл командой:

cat *.fasta > proteones.fa

Затем я создала базу данных для локального blast командой:

makeblastdb -dbtype prot -in proteones.fa -out proteones

Из файла с полным протеомом E. coli была вырезана последовательность белка CLPX и сохранена в отдельный файл clpx_ecoli.fasta:

seqret sw:clpx_ecoli -auto

Затем с помощью программы blastp был произведен поиск гомологов (с разумным порогом на E-value = 001) по протеомам отобранных бактерий.

blastp -query clpx_ecoli.fasta -db proteones -evalue 0.001 -out clpx.blastp

Файл со спиком находок:

Изображение

Далее я воспользоваласб программой Excel для создания списка гомологов, чьи последовательности требовалось получить из локаьного blast. С помощью MEGA(MUSCLE) были выровнены последовательности белков и построено дерево по методу Neighbor-joining. Скобочная формула:

Файл

Ортологи: HSLU LACAC - HSLU LACDA, Q5FKR6 LACAC - Q1GAP8 LACDA, CLPX CLOTE - CLPX MOOTA.
Парологи: CLPX CLOTE - HSLU CLOTE, M4YVY5 - STREQ и M4YVJ8 - STREQ, HSLU LACDA - Q1GB74.

На 1 рисунке 4 разными цветами выделены ортологичные группы, на втором - то же самое изображение, но в схлопнутом виде. Дерево белков тольок местами схоже с древом бактерий, например виды LACDA и LACAC на обоих разошлись в самый последний момент.

Oops
Oops