Занятие 8: Самостоятельная работа по аннотации участка генома
С использованием приведённых ниже команд получим фрагмент генома бактерии Ornithinibacillus scapharcae из записи AEWH01000006 банка EMBL длиной 7000 нуклеотидов (фрагмент 35001 - 42000) и определим, где в этом фрагменте закодированы белки, похожие на известные белки бактерии Bacillus subtilis:
seqret embl:aewh01000006 -outseq fragm.fasta -sbegin 35001 -send 42000 -sreverse n
getorf fragm.fasta fragm.orf -minsize 240 -table 11 -find 1
seqret sw:*_bacsu -outseq bacsu_proteome.fasta
makeblastdb -in bacsu_proteome.fasta -out bs -dbtype prot
blastp -query fragm.orf -db bs -out blastp.out -evalue 0.001 -outfmt 6
Полученную информацию об открытых рамках считывания в рассматриваемом фрагменте геноме сохраним в файле fragm_results.xlsx. Мы видим, что всего нашлось 12 открытых рамок (длиной не менее 240 нуклеотидов), для 8 из которых с помощью blastp были найдены сходные последовательности белков Bacillus sublitis.
Рассмотрим те открытые рамки, для которых нашлась хотя бы одна сходная последовательность:
Открытая рамка | Начало во фрагменте | Конец во фрагменте | Направление | Число найденных blastp сходных последовательностей | Идентификатор самого близкого из найденных белков | E-value находки |
AEWH01000006_1 | 1460 | 2632 | прямое | 3 | RODA_BACSU | 6e-50 |
AEWH01000006_2 | 2632 | 3435 | прямое | 1 | PRPE_BACSU | 5e-82 |
AEWH01000006_3 | 5929 | 6501 | прямое | 1 | YJBK_BACSU | 4e-37 |
AEWH01000006_4 | 6597 | 6974 | прямое | 1 | TRHBO_BACSU | 3e-38 |
AEWH01000006_6 | 5829 | 5161 | обратное | 3 | YJBM_BACSU | 6e-77 |
AEWH01000006_7 | 5142 | 4345 | обратное | 2 | PPNK1_BACSU | 7e-106 |
AEWH01000006_8 | 4323 | 3445 | обратное | 4 | YJBO_BACSU | 1e-83 |
AEWH01000006_12 | 1218 | 1 | обратное | 4 | MGTE_BACSU | 1e-71 |
Схематично изобразим положение приведённых в таблице выше рамок считывания на рассматриваемом фрагменте генома бактерии Ornithinibacillus scapharcae.
Гипотетические гены во фрагменте 35001–42000 записи AEWH01000006
3'[<= mgte, 1-1218]--------------------------------------------[<= yjbo, 3445-4323]------5' 5'-------------------[=> roda, 1460-2632][=> prpe, 2632-3435]----------------------------3' 3'-[<= ppnk1, 4345-5142]-[<= yjbm, 5161-5829]--------------------------------------------5' 5'--------------------------------------------[=> yjbk, 5929-6501]-[=> trhbo, 6597-6974]-3'
Теперь сравним взаимное расположение предполагаемых генов рассматриваемого фрагмента генома бактерии Ornithinibacillus scapharcae и гомологичных им генов в геноме сенной палочки. Для этого рассмотрим для каждого предсказанного гена наиболее сходный из белков Bacillus subtilis. В записи AL009126 банка EMBL, содержащей последовательность генома сенной палочки, найдём участки, кодирующие искомые белки, и рассмотрим их расположение в геноме:
3'-[<= trhbo, 1234510-1234908]-[<= yjbk, 1235912-1236484]----------------------------5' 5'--------------------------------------------------------[=> yjbm, 1237006-1237641]-3' 3'--------------------------------------------------------[<= prpe, 1239387-1240121]-5' 5'-[=> ppnk1, 1237660-1238460]-[=> yjbo, 1238523-1239374]----------------------------3' 3'----------------------------------[<= roda, 3912332-3913513]-----------------------5' 5'---[=> mgte, 1396013-1397368]------------------------------------------------------3'
Мы видим, что все гены, за исключением mgtE и rodA, расположены достаточно близко друг к другу. Взаимное расположение всех 6 из них совпадает с расположением предсказанных генов Ornithinibacillus scapharcae. Таким образом, группу из генов prpE, yjbO, ppnK1 (ppnKA), yjbM, yjbK и trHbO (yjbI) на основе сравнения двух геномов можно считать консервативной по взаимному расположению генов.