Был выдан неаннотированный фрагмент гемона Streptococcus pneumoniae(штамм TIGR4 ctg00822) (21001-28001 записи AAGY02000003)
Были найдены все открытые рамки считывания длиной более 240 нуклеотидов в этом фрагменте (программа getorf).
Параметры программы getorf: -minsize 240 -find 1 -table bacterial
Открытой рамкой считалась последовательность, начинающуюся со старт-кодона и заканчивающуюся стоп-кодоном.
Вего нашлось 13 открытых рамок.
Трансляции всех открытых рамок считывания были запущены на поиск в полном протеоме сеной палочки (программа blastp - поиск белковой последовательности в белковом банке).
Было подсчитано число находок с E-value < 0.001 (программа grep)
Были отобраны только те открытые рамки считывания, для которых число находок было больше 0:
Имя | Начало во фрагменте | Конец во фрагменте | Направление | Число находок BLASTP | идентификатор самого близкого из найденных белков B.subtilis | E-value | Координаты находки в геноме Bacillus subtilis записи AL009126 EMBL |
AAGY02000003_3 | 6783 | 6451 | обратное | 1 | COMGC_BACSU | 2e-04 | complement(2557673..2557969) |
AAGY02000003_9 | 4179 | 3229 | обратное | 1 | YTXK_BACSU | 2e-39 | complement(3016646..3017635) |
AAGY02000003_10 | 3205 | 1988 | обратное | 2 | ACKA_BACSU | 1e-126 | complement(3015111..3016298) |
AAGY02000003_11 | 1836 | 1468 | обратное | 1 | RNPA_BACSU | 1e-22 | complement(4214753..4215103) |
AAGY02000003_12 | 1496 | 669 | обратное | 2 | OXAA1_BACSU | 1e-34 | complement(4213823..4214608) |
AAGY02000003_13 | 665 | 3 | обратное | 1 | JAG_BACSU | 2e-08 | complement(4213200..4213826) |
Чтобы выяснить, каким образом расположены в геноме Bacillus subtilis гены, гомологичные соответствующим в выше расположенном фрагменте, скачала, во-первых, этот геном, а во-вторых, занесла в один fasta-файл все белковые последовательности, названия которых представлены в таблице выше. Далее создала "нуклеиновые" индексные файлы из данного генома и воспользовался программой tblastn для поиска в нем участков ДНК, кодирующих данные белки (т.е. identity находок должно быть 100%, а evalue 0.0):
tblastn -query buc_prot.fasta -db bac_gen -out tblastn.fasta -evalue 0.001 -outfmt 7
Но в результате далеко не везде identity было 100%, поэтому опираясь на полученные данные, я воспользовалась записью AL009126 EMBL (полный геном Bacillus subtilis), чтобы определить точные координаты гомологов.
Гипотетические гены во фрагменте 21001–28001 записи AAGY02000003
5'-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------3' 3'-[<= JAG_BACSU, 3-665][<= OXAA1_BACSU, 669-1496][<= RNPA_BACSU, 1468-1836]-------[<= ACKA_BACSU, 1988-3205]-[<= YTXK_BACSU, 3229-4179]----------------------[<= COMGC_BACSU, 6451-6783]----5'
Гены в геноме Bacillus subtilis (координаты по записи AL009126 EMBL)
5'------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------3' 3'--[<= COMGC_BACSU, 2557673-2557969]---[<= ACKA_BACSU, 3015111-3016298]-[<= YTXK_BACSU, 3016646-3017635]------[<= JAG_BACSU, 4213200-4213826][<= OXAA1_BACSU, 4213823..4214608][<= RNPA_BACSU, 4214753..4215103]---5'
В Bacillus subtilis гены располагаются в другом порядке, нежели гомологичные им открытые рамки в Streptococcus pneumoniae. Однако можно заметить, что в обоих случаях COMGC_BACSU стоит несколько отдельно и располагается с краю, по отношению к остальным генам (в стороне на 2268 (getorf не учитывает стоп-кодоны) нуклеотид во фрагменте и на 457141 нуклеотид в геноме).
ACKA_BACSU и YTXK_BACSU в обоих случаях располагаются друг за другом на небольшом расстоянии(всего 23 нуклеотида! во врагменте и 347 в геноме) и находятся в середине, по отношению к остальным. Возможно они как-то транскрипционно связаны.
А JAG_BACSU, OXAA1_BACSU и RNPA_BACSU стоят рядом именно в такой последовательности(во фрагменте между ними всего 3 и 1 нуклеотид соответственно).
Гены JAG_BACSU и OXAA1_BACSU у Bacillus subtilis перекрываются на 4 нуклеотида, оказывается перекрывание на несколько п.о. между генами прокариот вполен возможно, в данном случае оно имеет вид "gtga", где tga - стоп-кодон OXAA1_BACSU, а gtg - старт-кодон JAG_BACSU. Такое тесное расположение указывает на возможную связь между ними.
Расстояния между генами в Bacillus subtilis намного больше, что, возможно вызвано тем, что размер исследуемого фрагмента генома Streptococcus pneumoniae всего 7000 нуклеотидов.