Поиск гомологов белка CLPX_ECOLI

Гомологи данного белка я искал в 7 бакетриях: Bartonella henselae (BARHE), Bordetella pertussis (BORPE), Brucella suis biovar 1 (BRUSU), Burkholderia mallei (BURMA), Saccharophagus degradans (SACD2), Serratia proteamaculans (SERP5), Shewanella denitrificans (SHEDO).

Были скачаны протеомы этих бактерий, объединены в один файл database.fa и была создана база данных:

# база данных
makeblastdb -in database.fa -dbtype prot

Также была скачена последовательность белка CLPX_ECOLI. Далее был произведён поиск гомологов с помощью blastp:

# blastp
blastp -query P0A6H1.fasta -db database.fa -evalue 0.0001 -outfmt 7 -out out.txt

Список наxодок blast в файле.

Дальше были отобраны нужные белки (ura.fa) из протеомов и сделано выравнивание:

# выравнивание
muscle -align ura.fa -output aligned_ura.fa

Далее выравнивание было переведено в другой формат и было построено дерево с помощью программы IQTree:

# построение дерева
iqtree -s ura.phy -B 1000

Было получено дерево (рис. 1). Скобочная формула.

тРНК
Рисунок 1. Дерево построенное с помощью программы IQTree. Bootstrap представлен в процентах.

Далее дерево было укоренено в среднюю точку (рис. 2).

тРНК
Рисунок 2. Дерево построенное с помощью программы IQTree. Укоренено в среднюю точку. Bootstrap представлен в процентах.

Два гомологичных белка будем называть ортологами, если они: а) из разных организмов; б) разделение их общего предка на линии, ведущие к ним, произошло в результате видообразования. Два гомологичных белка из одного организма будем называть паралогами.

Ниже представлены 3 пары ортологов:

И 3 пары паралогов:

Далее дерево было редактировано. Были покрашены ортологические группы в разные цвета (рис. 3), а ткаже эти группы были схлопнуты (рис. 4).

тРНК
Рисунок 3. Дерево построенное с помощью программы IQTree. Укоренено в среднюю точку. Цветом покрашены ортологические группы. Bootstrap представлен в процентах.
тРНК
Рисунок 4. Дерево построенное с помощью программы IQTree. Укоренено в среднюю точку. Цветом покрашены ортологические группы. Bootstrap представлен в процентах. В группе CLPX - представлены белки CLPX из всех бактерий; филогения белков соответсвует филогении бактерий. В группе HSLU - представлены белки HSLU из всех бактерий; филогения белков соответсвует филогении бактерий. В группе ftsH - представлены белки FtsH из бактерий SERP5, BURMA, BRUSU, BARHE; филогения белков не соответсвует филогении бактерий (SERP5 не должен быть базальнее других бактерий).

За верную филогению взята та, что представлена на рис. 5.

тРНК
Рисунок 5. Верная филогения бактерий.