Самостоятельная работа

Скачать файл Excel с результатами выполнения задания

Был выдан неаннотированный фрагмент гемона Streptococcus pneumoniae(штамм TIGR4 ctg00822) (21001-28001 записи AAGY02000003)

Были найдены все открытые рамки считывания длиной более 240 нуклеотидов в этом фрагменте (программа getorf).
Параметры программы getorf: -minsize 240 -find 1 -table bacterial
Открытой рамкой считалась последовательность, начинающуюся со старт-кодона и заканчивающуюся стоп-кодоном.

Вего нашлось 13 открытых рамок.

Трансляции всех открытых рамок считывания были запущены на поиск в полном протеоме сеной палочки (программа blastp - поиск белковой последовательности в белковом банке).
Было подсчитано число находок с E-value < 0.001 (программа grep)

Были отобраны только те открытые рамки считывания, для которых число находок было больше 0:

Имя Начало во фрагменте Конец во фрагменте Направление Число находок BLASTP идентификатор самого близкого из найденных белков B.subtilis E-value Координаты находки в геноме Bacillus subtilis записи AL009126 EMBL
AAGY02000003_3 6783 6451 обратное 1 COMGC_BACSU 2e-04 complement(2557673..2557969)
AAGY02000003_9 4179 3229 обратное 1 YTXK_BACSU 2e-39 complement(3016646..3017635)
AAGY02000003_10 3205 1988 обратное 2 ACKA_BACSU 1e-126 complement(3015111..3016298)
AAGY02000003_11 1836 1468 обратное 1 RNPA_BACSU 1e-22 complement(4214753..4215103)
AAGY02000003_12 1496 669 обратное 2 OXAA1_BACSU 1e-34 complement(4213823..4214608)
AAGY02000003_13 665 3 обратное 1 JAG_BACSU 2e-08 complement(4213200..4213826)


Чтобы выяснить, каким образом расположены в геноме Bacillus subtilis гены, гомологичные соответствующим в выше расположенном фрагменте, скачала, во-первых, этот геном, а во-вторых, занесла в один fasta-файл все белковые последовательности, названия которых представлены в таблице выше. Далее создала "нуклеиновые" индексные файлы из данного генома и воспользовался программой tblastn для поиска в нем участков ДНК, кодирующих данные белки (т.е. identity находок должно быть 100%, а evalue 0.0):

tblastn -query buc_prot.fasta -db bac_gen -out tblastn.fasta -evalue 0.001 -outfmt 7

Но в результате далеко не везде identity было 100%, поэтому опираясь на полученные данные, я воспользовалась записью AL009126 EMBL (полный геном Bacillus subtilis), чтобы определить точные координаты гомологов.

Гипотетические гены во фрагменте 21001–28001 записи AAGY02000003

5'-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------3'
3'-[<= JAG_BACSU, 3-665][<= OXAA1_BACSU, 669-1496][<= RNPA_BACSU, 1468-1836]-------[<= ACKA_BACSU, 1988-3205]-[<= YTXK_BACSU, 3229-4179]----------------------[<= COMGC_BACSU, 6451-6783]----5'


Гены в геноме Bacillus subtilis (координаты по записи AL009126 EMBL)

5'------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------3'
3'--[<= COMGC_BACSU, 2557673-2557969]---[<= ACKA_BACSU, 3015111-3016298]-[<= YTXK_BACSU, 3016646-3017635]------[<= JAG_BACSU, 4213200-4213826][<= OXAA1_BACSU, 4213823..4214608][<= RNPA_BACSU, 4214753..4215103]---5'


В Bacillus subtilis гены располагаются в другом порядке, нежели гомологичные им открытые рамки в Streptococcus pneumoniae. Однако можно заметить, что в обоих случаях COMGC_BACSU стоит несколько отдельно и располагается с краю, по отношению к остальным генам (в стороне на 2268 (getorf не учитывает стоп-кодоны) нуклеотид во фрагменте и на 457141 нуклеотид в геноме).
ACKA_BACSU и YTXK_BACSU в обоих случаях располагаются друг за другом на небольшом расстоянии(всего 23 нуклеотида! во врагменте и 347 в геноме) и находятся в середине, по отношению к остальным. Возможно они как-то транскрипционно связаны.
А JAG_BACSU, OXAA1_BACSU и RNPA_BACSU стоят рядом именно в такой последовательности(во фрагменте между ними всего 3 и 1 нуклеотид соответственно).

Гены JAG_BACSU и OXAA1_BACSU у Bacillus subtilis перекрываются на 4 нуклеотида, оказывается перекрывание на несколько п.о. между генами прокариот вполен возможно, в данном случае оно имеет вид "gtga", где tga - стоп-кодон OXAA1_BACSU, а gtg - старт-кодон JAG_BACSU. Такое тесное расположение указывает на возможную связь между ними.

Расстояния между генами в Bacillus subtilis намного больше, что, возможно вызвано тем, что размер исследуемого фрагмента генома Streptococcus pneumoniae всего 7000 нуклеотидов.