Ралдугина Василиса

Студентка Факультета биоинженерии и биоинформатики

МГУ имени М.В. Ломоносова

Обо мне

Главная

Сайт ФББ МГУ

Построение и анализ дерева, содержащего паралоги.

Белки-гомологи - белки, имеющие общее происхождение.
Ортологи - белки, которые разошлись в результате видообразования. Таким образом, белки-ортологи находятся в организмах разных видов и, как правило, выполняют схожие функции.
Паралоги - белки, образовавшиеся в результате дупликации генов. Следовательно, такие белки существуют в одном организме и эволюционируют почти независимо друг от друга, а значит, могут сильно различаться в функциях.

1. Поиск гомологов.

Поиск достоверных гомологов указанного белка вёлся среди протеомов перечисленных бактерий:

Видовое название МнемоникаТаксономия
Serratia proteamaculansSERP5 cellular organisms; Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacterales; Yersiniaceae; Serratia
Proteus mirabilisPROMH cellular organisms; Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacterales; Morganellaceae; Proteus
Saccharophagus degradansSACD2 cellular organisms; Bacteria; Proteobacteria; Gammaproteobacteria; Cellvibrionales; Cellvibrionaceae; Saccharophagus
Pseudomonas mendocina PSEMY cellular organisms; Bacteria; Proteobacteria; Gammaproteobacteria; Pseudomonadales; Pseudomonadaceae; Pseudomonas; Pseudomonas aeruginosa group
Rhizobium meliloti RHIME cellular organisms; Bacteria; Alphaproteobacteria; Rhizobiales; Rhizobiaceae; Sinorhizobium/Ensifer group; Sinorhizobium
Brucella suis BRUSU cellular organisms; Bacteria; Alphaproteobacteria; Rhizobiales; Brucellaceae; Brucella
Neisseria meningitidisNEIMAcellular organisms; Bacteria; Proteobacteria; Betaproteobacteria; Neisseriales; Neisseriaceae; Neisseria
Aromatoleum aromaticumAROAE cellular organisms; Bacteria; Proteobacteria; Betaproteobacteria; Rhodocyclales; Rhodocyclaceae; Aromatoleum

Перед началом работы протеомы бактерий были собраны в единый файл compiled.fasta. Последовательность белка, гомологи которого надо отыскать, была сохранена в файл CLPX_ECOLI.fasta.

Затем из файла с протеомами была создана база данных для дальнейшего поиска гомологов.
Командная строка: makeblastdb -in compiled.fasta -dbtype prot

Далее был запущен поиск с помощью алгоритма BLASTP.
Командная строка: blastp -query CLPX_ECOLI.fasta -db compiled.fasta -evalue 0.001 -out blast.out -outfmt 7 -num_alignments 50

Из найденных белков я выбрала самые достоверные гомологи (исходя из E-value). Аминокислотные последовательности этих белков собраны в файл chosen.fasta.

Далее было построено выравнивание всех последовательностей.
Командная строка: muscle -in chosen.fasta -out align.fasta

На основе полученного файла методом Минимальной эволюции (Minimum Evolution) было построено филогенетическое дерево.


Рис.1. Филогенетическое дерево.

Оттенками розового и бирюзового отмечены ортологи - CLPX и HSLU (ATP-dependent protease ATPase subunit HslU; субъединица входящая в состав той же АТФ-зависимой протеазы). Сиреневым отмечены паралоги RHIME, салатовым - паралоги PSEMY, светло-розовым - паралоги SERP5. Паралоги - белки, имеющие общего предка и находящиеся в организме одного вида, однако функционально разошедшиеся в ходе эволюции.

© Raldugina Vasilisa 2016