Учебный сайт

Бредихина Данилы

Учебный сайт Бредихина Данилы

Занятие 8: Самостоятельная работа по аннотации участка генома

С использованием приведённых ниже команд получим фрагмент генома бактерии Ornithinibacillus scapharcae из записи AEWH01000006 банка EMBL длиной 7000 нуклеотидов (фрагмент 35001 - 42000) и определим, где в этом фрагменте закодированы белки, похожие на известные белки бактерии Bacillus subtilis:

seqret embl:aewh01000006 -outseq fragm.fasta -sbegin 35001 -send 42000 -sreverse n
getorf fragm.fasta fragm.orf -minsize 240 -table 11 -find 1
seqret sw:*_bacsu -outseq bacsu_proteome.fasta
makeblastdb -in bacsu_proteome.fasta -out bs -dbtype prot
blastp -query fragm.orf -db bs -out blastp.out -evalue 0.001 -outfmt 6

Полученную информацию об открытых рамках считывания в рассматриваемом фрагменте геноме сохраним в файле fragm_results.xlsx. Мы видим, что всего нашлось 12 открытых рамок (длиной не менее 240 нуклеотидов), для 8 из которых с помощью blastp были найдены сходные последовательности белков Bacillus sublitis.

Рассмотрим те открытые рамки, для которых нашлась хотя бы одна сходная последовательность:

Открытая рамка Начало во фрагменте Конец во фрагменте Направление Число найденных blastp сходных последовательностей Идентификатор самого близкого из найденных белков E-value находки
AEWH01000006_1 1460 2632 прямое 3 RODA_BACSU 6e-50
AEWH01000006_2 2632 3435 прямое 1 PRPE_BACSU 5e-82
AEWH01000006_3 5929 6501 прямое 1 YJBK_BACSU 4e-37
AEWH01000006_4 6597 6974 прямое 1 TRHBO_BACSU 3e-38
AEWH01000006_6 5829 5161 обратное 3 YJBM_BACSU 6e-77
AEWH01000006_7 5142 4345 обратное 2 PPNK1_BACSU 7e-106
AEWH01000006_8 4323 3445 обратное 4 YJBO_BACSU 1e-83
AEWH01000006_12 1218 1 обратное 4 MGTE_BACSU 1e-71

Схематично изобразим положение приведённых в таблице выше рамок считывания на рассматриваемом фрагменте генома бактерии Ornithinibacillus scapharcae.

Гипотетические гены во фрагменте 35001–42000 записи AEWH01000006

3'[<= mgte, 1-1218]--------------------------------------------[<= yjbo, 3445-4323]------5' 5'-------------------[=> roda, 1460-2632][=> prpe, 2632-3435]----------------------------3' 3'-[<= ppnk1, 4345-5142]-[<= yjbm, 5161-5829]--------------------------------------------5' 5'--------------------------------------------[=> yjbk, 5929-6501]-[=> trhbo, 6597-6974]-3'

Теперь сравним взаимное расположение предполагаемых генов рассматриваемого фрагмента генома бактерии Ornithinibacillus scapharcae и гомологичных им генов в геноме сенной палочки. Для этого рассмотрим для каждого предсказанного гена наиболее сходный из белков Bacillus subtilis. В записи AL009126 банка EMBL, содержащей последовательность генома сенной палочки, найдём участки, кодирующие искомые белки, и рассмотрим их расположение в геноме:

3'-[<= trhbo, 1234510-1234908]-[<= yjbk, 1235912-1236484]----------------------------5' 5'--------------------------------------------------------[=> yjbm, 1237006-1237641]-3' 3'--------------------------------------------------------[<= prpe, 1239387-1240121]-5' 5'-[=> ppnk1, 1237660-1238460]-[=> yjbo, 1238523-1239374]----------------------------3' 3'----------------------------------[<= roda, 3912332-3913513]-----------------------5' 5'---[=> mgte, 1396013-1397368]------------------------------------------------------3'

Мы видим, что все гены, за исключением mgtE и rodA, расположены достаточно близко друг к другу. Взаимное расположение всех 6 из них совпадает с расположением предсказанных генов Ornithinibacillus scapharcae. Таким образом, группу из генов prpE, yjbO, ppnK1 (ppnKA), yjbM, yjbK и trHbO (yjbI) на основе сравнения двух геномов можно считать консервативной по взаимному расположению генов.


Ссылки

  1. Файл fragm_results.xlsx.
< На страницу семестра ∧ Наверх