На главную страницу сайта
На главную страницу третьего семестра
 

Программы пакета BLAST для работы с нуклеотидными последовательностями

Поиск гомологов белка BTUB_ECOLI в геномах родственных бактерий

Сначала был проведен поиск гомологов белка BTUB_ECOLI в геноме Pasteurella multocida. Для этого были созданы индексные файлы, соответствующие этому геному при помощи программы formatdb:

formatdb -i /home/export/samba/public/tmp/pm_genome.fasta -p F -n pm

Выравнивание получено запуском программы blastall, для поиска был выбран алгоритм tblastn:

blastall -d pm -i btub.fasta -o btub-pm.out -p tblastn

После анализа результатов при помощи программы entret была получена запись EMBL, соответствующая лучшей находке.
Поиск по трем геномам (Xanthomonas campestris, Salmonella typhimurium и Pasteurella multocida) проводился аналогичным образом, но индексные файлы создавались сразу для трех организмов. Для этого были введены две переменные:

genpath=/home/export/samba/public/tmp
genomes="$genpath/xc_genome.fasta $genpath/st_genome.fasta $genpath/pm_genome.fasta"

Создание индексных файлов осуществлялось следующим образом:

formatdb -i "$genomes" -n 3g -p F

Выравнивание было получено аналогично предыдущему поиску.

Результаты поиска представлены в таблице:

Поиск гомологов BTUB_ECOLI в геноме Pasteurella multocida
Число находок с Е-value<0,001 7
Характеристика лучшей находки:  
   E-value находки 6e-7
AC соответствующей записи EMBL AE006199
Kоординаты выравнивания в записи EMBL
  • BTUB_ECOLI: 49-165
  • Q9CKJ4_PASMU: 3559-3918
Координаты CDS в записи EMBL 3358-5904
AC UniProt в записи EMBL Q9CKJ4
Поиск гомологов BTUB_ECOLI в геномах
Salmonella typhimurium, Xanthomonas campestris и Pasteurella multocida
Е-value лучшей находки предыдущего поиска 3е-06
Число находок с Е-value<0,001 49
E-value лучшей находки 0.0

Увеличение E-value AE006199 при поиске по трем геномам связано с возрастанием объема банка данных. При этом эта находка теперь находится на 36 месте, хотя из Pasteurella multocida она остается лучшей. Таким образом можно сказать, что в Pasteurella multocida нет белков достаточно близких по строению и функции к btuB. По видимому, это связано с наличием другого метода транспорта крупных молекул (в частности, содержащих корриновые и порфириновые кольца), при помощи белков-переносчиков с отличной от btuB структурой. А вот в Xanthomonas campestris и Salmonella typhimurium шанс найти схожие белки гораздо выше. Проведя поиск по базе SwissProt, действительно было обнаружено что белок соответсвующий лучшей находке (AC:AE008893) — это BTUB_SALTY из Salmonella typhimurium, который является непосредственным родственником BTUB_ECOLI и выполняет ту же функцию — транспорт кобаламина. Вторая находка из Xanthomonas campestris (AC:AE012421) соответствует белку Q8P6A3_XANCP, который является рецептором витамина В12.

Поиск гомологов гена, кодирующего белок BTUB_ECOLI, с помощью программы BLASTN.

По результатам e-value лучшей находки предыдущего поиска увеличился до 4e-68. Это можно объяснить увеличением объема базы данных(с аминокислотной до нуклеотидной). E-value второй и третьей находки гораздо выше (3e-04). Причем большое число хоть сколько-нибудь отдаленных гомологов вообще не были найдены, например AC:AE012421. Таким образом видно, что непосредственных родственников программа BLASTN находит с лёкостью, но когда речь идет о небольших расхождениях, ей не под силу разобрать кто из кандитатов ближе, не говоря уже об очень дальних гомологах.

 

 

 

 


© Донченко Иван, 2007