Практикум 4

Задание 1

В данном задании было необходимо составить список белков, гомологичных белку CLPX_ECOLI среди белков выбранных бактерий. Я выбрал следующие бактерии:
Название Мнемоника
Bacillus subtilis BACSU
Geobacillus kaustophilus GEOKA
Staphylococcus aureus STAA8
Lactobacillus acidophilus LACAC
Enterococcus faecalis ENTFA
Moorella thermoacetica MOOTA
Clostridium botulinum CLOBH
Сначала я объединил протеомы выбранных бактерий в один файл. Далее из него была создана база данных для программы blastp при помощи команды:
makeblastdb -dbtype prot -in prot.fasta -out prot
Далее был проведен поиск гомологов при помощи blastp:
blastp -query CLPX_ECOLI.fasta -db prot -evalue 0.001 -out CLPX_ECOLI.blastp 
Список находок:

Задача 2

Последовательности найденных белков были вырезаны и загружены в программу MEGA, с её помощью выровнены (MUSCLE). Затем было построено дерево методом Neighbour-Joining. Ортологи: HSLU_ENTFA и HSLU_LACAC, CLPY_BASCU и HSLU_GEOKA, CLPX_CLOBH и CLPX_MOOTA. Парологи: A5MYU4_CLOBH и A5I766_CLOBH, CLPX_GEOKA и HSLU_GEOKA, FTSH_BACSU и CLPE_BACSU.
Дерево с выделенными ортологическими группами:
  1. Группа 1 содержит белки (Q5FKR6_LACAC, CLPX_GEOKA, CLPX_MOOTA, CLPX_BACSU, CLPX_STAA8, CLPX_CLOBH, CLPX_ENTFA) из всех бактерий. Филогения белков соответствует филогении бактерий.
  2. Группа 2 содержит 6 белков (HSLU_ENTFA, HSLU_LACAC, Q2RJP5_MOOTA, HSLU_STAA8, CLPY_BACSU, HSLU_GEOKA) из всех бактерий кроме CLOBH. Филогения банных белков так же соответствует филогении бактерий
  3. В 3 группу вошли белки (Q5FHW6_LACAC, CLPL_STAA8, CLPE_BACSU, Q5L436_GEOKA) из бактерий LACAC, STAA8, BACSU и GEOKA. Филогения так же соответствует филогении бактерий.
  4. Группа 4 состоит из 6 белков (Q5FMA3_LACAC, Q839B1_ENTFA, A5I7Q0_CLOBH, Q2RM95_MOOTA,Q5L3T1_GEOKA, FTSH_BACSU) из всех бактерий кроме STAA8. Филогения данной группы белков также соответствует филогении бактерий.
Дерево с скрытыми группами: