Учебный сайт Карины Сим
  • Главная
  • Семестры
  • Обо мне
  • ФББ

    Практикум 4

    Составление списка гомологичных белков

    Для начала были выбраны полные протеомы 8 бактерий отдела Pseudomonadota. Для удобства я скопировала выбранные протеомы к себе в директорию при помощи следующей команды:

    cp AROAE.fasta BORPE.fasta BRUSU.fasta HAEIN.fasta NEIMA.fasta PASMU.fasta RHIME.fasta YERPE.fasta

    Далее я объединила выбранные протеомы в один файл:

    cat * > prot.fasta

    Следующим этапом я создала белковую базу посредством следующей команды:

    makeblastdb -in prot.fasta -dbtype prot -out protdb.fasta

    После этого был произведен поиск гомологов белка CLPX_ECOLI в выбранных протеомах при помощи программы blastp (порог e-value = 0,0001):

    blastp -task blastp -query P0A6H1.fasta -db protdb.fasta -out result -evalue 0.0001

    Список находок без выравниваний и заголовка выдачи

    Реконструкция и визуализация

    Последовательности находок были помещены в fasta-файл. Названия были отредактированы таким образом, чтобы остались только ID.

    Файл с последовательностями находок

    Далее данные последовательности были выровнены при помощи следующей команды:

    muscle -align spisok.fasta -output spisok-alignment.fasta

    Далее полученное выравнивание было переведено в формат phylip-relaxed при помощи пакета BioPython.

    После этого была произведена реконструкция дерева при помощи программы IQ-Tree (параметры по умолчанию):

    iqtree -s spisok.phy

    Файл с формулой Newick

    Далее я визуализировала данное дерево сервисом ITOL и укоренила в среднюю точку.

    Ортологи: CLPX_RHIME и CLPX_BRUSU, CLPX_AROAE и CLPX_BORPE, HSLU_PASMU и HSLU_HAEIN.

    Паралоги: HSLU_BORPE и CLPX_BORPE, HSLU_BRUSU и CLPX_BRUSU, HSLU_PASMU и CLPX_PASMU.

    В начале я раскрасила разные ортологические группы (наборы попарно ортологичных белков) в разные цвета (рисунок 1).

    При этом группы, которые содержат три и менее последовательностей, я оставила черными.

    Рисунок 1
    Рисунок 1. Филогенетическая реконструкция программой IQ-Tree. Разными цветами показаны разные ортологические группы.

    После этого все ортологические группы, содержащие больше трех последовательностей, были "схлопнуты" (рисунок 2).

    Рисунок 2
    Рисунок 2. Изображение реконструированного дерева с "схлопнутыми" ортологическими группами.

    Ортологическая группа, окрашенная красным цветом, содержит белки из всех 8 выбранных бактерий. При этом реконструированная филогения данного белка (CLPX) соответствует филогении бактерий.

    Ортологическая группа, окрашенная голубым цветом, содержит белки из 7 бактерий (всего – 8). Реконструированная филогения данного белка (HSLU) лишь частично соответствует филогении бактерий: на реконструированном дереве клада (HSLU_AROAE,HSLU_BORPE) более сближена с кладой (HSLU_BRUSU,HSLU_RHIME) по сравнению с кладой (HSLU_YERPE,(HSLU_PASMU,HSLU_HAEIN)).

    Однако если мы рассмотрим филогению бактерий (рисунок 3), то увидим, что клада (AROAE,BORPE) более близка к кладе (YERPE,(PASMU,HAEIN)) по сравнению с кладой (BRUSU,RHIME).

    Рисунок 2
    Рисунок 3. Филогения бактерий, которую мы считаем верной при выполнении данного практикума.