Вариант1


Для поиска закодированых в неаннотированном фрагменте генома Yersinia intermedia (28001-68001) белков, похожих на белки из Salmonella typhimurium была использована программа blastx (программа, которая часто используется на первом этапе анализа новых нуклеотидных последовательностей для предсказания кодирующих участков). Поэтому при создании индексных файлов необходимо указать тип данных Т (белки), а не нуклеотиды.

Использованные для выполнения задания команды:
seqret embl:AALF01000001 -sask
(в результате получен файл aalf01000001.fasta, содержащий фрагмент последовательности 28001-68001)
formatdb -i salty_proteome.fasta -p T -n sa
(созданы индексные файлы для программы blastx)
blastall -p blastx -d sa -i aalf01000001.fasta -o blastx_result.fasta -e 0.001
(запуск программы из пакета BLAST)

Гипотетические гены во фрагменте 28001-32000


3'-------[<=ген yceE, 1314...112]-----------[<=ген ddg, 3146...2247]-- -----[<=ген htrB, 3152...2247]----------[<=ген ttrR, 3999...3454]----------5'
    Пояснения:
  • Предполагаемые гены найдены на комплементарной (<=) цепи.
  • Как видно две пары генов перекрываются, причем ddg и htrB практически совпадают (длина гена ddg на 7 нуклеотидов больше).
  • В геноме сальманеллы гены ttrR и ddg распалагаются на прямой цепи, остальные из указанных на комплементарной. Гены ddg и htrB в аннотированном геноме не пересекаются вообще, а также лежат на разных цепях.

Для этих четырех генов были найдены следующие гомологи в геноме сальмонеллы:
AC белка E-value Ген
Q8ZQ25 e-169 yceE
Q8ZQ24 e-116 htrB
Q8ZRF1 e-116 STM0382
Q8ZNA3 1e-91 ddg
Q7CQM8 7e-57 ttrR
В таблице представлены 5 лучших находок (вероятно являющихся гомологичными объектами для участков неаннотированного генома Yersinia intermedia), в порядке убывания E-value. Аннотацию к этим находкам можно увидеть здесь.

Все гены, кодирующие белки сальмонеллы, находятся в разных секторах генома, кроме Q8ZQ24 и Q8ZQ25. Они находятся в записи EMBL:AE008750, гены располагаются рядом: htrB - complement(6404..7324) , yceE - complement(5035..6249). Расстояние между ними состаляет 156 нуклеотидов. Найденные гены находятся достаточно далеко друг от друга, два из них, как указано выше практически совпадают.

© Головкина Мария Сергеевна