Главная Oбо мне Семестры Контактная информация

Практикум 1. Филогенетическое дерево.

Отобранные бактерии.

Rhizobium etliRHIEC
Rhodobacter sphaeroides RHOS4
Burkholderia cenocepaciaBURCA
Ralstonia solanacearum RALSO
Escherichia coli ECOLI
Salmonella typhimurium SALTY
Yersinia pseudotuberculosis YERPS
Haemophilus influenzae HAEIN

Cкобочная формула дерева.

((RHIEC, RHOSY),((RALSO, BURCA),(HAEIN, (YERPS, (ECOLI,SALTY)))))

Филогенетическое дерево.

По приведенному в задании дереву было построено новое, включающее только отобранные бактерии.

Новое дерево Исходное дерево

Нетривиальные ветви.

Мы называем ветвь нетривиальной, если она разбивает множество листьев на подмножества, в каждом из которых более одного элемента.

Данное дерево содержит 5 нетривиальных ветвей:

  1. (RHIEC, RHOS4) против (RALSO, BURCA, HAEIN, YERPS, ECOLI, SALTY)
  2. (RALSO, BURCA) против (RHIEC, RHOS4, HAEIN, YERPS, ECOLI, SALTY)
  3. (ECOLI, SALTY) против (RHIEC, RHOS4, RALSO, BURCA, HAEIN, YERPS)
  4. (ECOLI, SALTY, YERPS) против (RHIEC, RHOS4, RALSO, BURCA, HAEIN)
  5. (ECOLI, SALTY, YERPS, HAEIN) против (RHIEC, RHOS4, RALSO, BURCA)

Практикум 2. Реконструкция филогении.

Таксономия отобранных организмов

Rhizobium etliRHIECBacteria; Proteobacteria; Alphaproteobacteria; Rhizobiales; Rhizobiaceae; Rhizobium/Agrobacterium group; Rhizobium
Rhodobacter sphaeroides RHOS4Bacteria; Proteobacteria; Alphaproteobacteria; Rhodobacterales; Rhodobacteraceae; Rhodobacter
Burkholderia cenocepaciaBURCABacteria; Proteobacteria; Betaproteobacteria; Burkholderiales; Burkholderiaceae; Burkholderia; Burkholderia cepacia complex
Ralstonia solanacearum RALSOBacteria; Proteobacteria; Betaproteobacteria; Burkholderiales; Burkholderiaceae; Ralstonia
Escherichia coli ECOLIBacteria; Proteobacteria; Gammaproteobacteria; Enterobacterales; Enterobacteriaceae; Escherichia
Salmonella typhimurium SALTYBacteria; Proteobacteria; Gammaproteobacteria; Enterobacterales; Enterobacteriaceae; Salmonella; Salmonella enterica; Salmonella enterica subsp. enterica
Yersinia pseudotuberculosis YERPSBacteria; Proteobacteria; Gammaproteobacteria; Enterobacterales; Yersiniaceae; Yersinia; Yersinia pseudotuberculosis complex
Haemophilus influenzae HAEINBacteria; Proteobacteria; Gammaproteobacteria; Pasteurellales; Pasteurellaceae; Haemophilus

Сравнение филогенетического дерева и таксономии.

Легко заметить, что все организмы относятся к Bacteria и Proteobacteria. Далее приведены нетривиальные ветви, соответствующие определенным таксонам.

ВетвьСоответствующий таксон
(RHIEC, RHOS4) против (RALSO, BURCA, HAEIN, YERPS, ECOLI, SALTY) Alphaproteobacteriа
(RALSO, BURCA) против (RHIEC, RHOS4, HAEIN, YERPS, ECOLI, SALTY) Betaproteobacteria; Burkholderiales; Burkholderiaceae
(ECOLI, SALTY) против (RHIEC, RHOS4, RALSO, BURCA, HAEIN, YERPS) Enterobacteriaceae
(ECOLI, SALTY, YERPS) против (RHIEC, RHOS4, RALSO, BURCA, HAEIN) Enterobacterales
(ECOLI, SALTY, YERPS, HAEIN) против (RHIEC, RHOS4, RALSO, BURCA) Gammaproteobacteria

Задание 4. Построение и анализ дерева, содержащего паралоги.

Для белков, перечисленных выше нашла достоверных гомологов белка CLPX_ECOLI. Чтобы найти гомологов в заданных организмах, воспользовалась файлами, лежащими на kodomo в директории /P/y16/term4/Proteomes (они содержат скачанные из Uniprot полные протеомы бактерий, перечисленных выше). Провела поиск программой blastp гомологов (с порогом на E-value 0,001) по протеомам отобранных бактерий. Использованные команды:

  1. cat file1 >> file2 - записала файлы с протеомами бактерий в 1
  2. makeblastdb -in file1.fasta -dbtype prot -out database.fasta - создание базы данных
  3. blastp -query СLPX_ECOLI.fasta -evalue 0.001 -db database.fasta -outfmt 6 -out proteins.fasta - получение списка найденных гомологов
  4. muscle -in 4ex.fasta -out 4exalign.fasta - выровняла последовательности гомологичных белков

Далее для построения дерева использовала мегу, применяя метод максимального сходства.

На данном дереве отражены гомологи CLPX_ECOLI во всех отобранных бактериях:

организмгомолог
SALTYCLPX, FITSH, YIFB (скорее всего ген дуплицировался два раза, по отношению друг к другу - парологи)
YEPRSCLPX, HSLU (дупликация, парологи)
HAEINCLPX
BURCACLPX, HSLU (дупликация, парологи)
RALSOCLPX
RHIECCLPX
RHOS4CLPX, HSLU (дупликация, парологи)

Cтоит отметить, что филогенетическое положение организмов не изменилось (по сравнению с двумя другими деревьями полченными ранее).

Два гомологичных белка будем называть ортологами, если они: а) из разных организмов; б) разделение их общего предка на линии, ведущие к ним, произошло в результате видообразования. Два гомологичных белка из одного организма будем называть паралогами. Примеры ортологов:

  1. CLPX - для всех отобранных бактерий
  2. FITSH - SALTY, ECOLI
  3. HSLU - RHOS4, BURCA, YEPRS