include ("../../inc/apss.inc"); ?>
Дано: неаннотированный фрагмент генома бактерии Regiella insecticola Был получен фрагмент генома Regiella insecticola из заданной записи EMBL с заданным началом (35001),
длиной 7000 нуклеотидов. Было определено, где в этом фрагменте закодированы белки, похожие на
известные белки бактерии Escherichia coli штамма K12. Скачать файл Excel, включающий информацию обо всех открытых рамках
считывания в фрагменте генома(35001-42000) Regiella insecticola.
Вывод:
Занятие 10 (зачётное)
Задача: определить, где в данном фрагменте закодированы белки, похожие на известные белки родственной бактерии (кишечной палочки).
белков из E. coli.
AC рамки
начало
конец
направление
число сходных последовательностей
в протеоме E. coli K 12идентификатор самого близкого из найденных белков
E-value находки
AC192956_1
1
336
прямое
1
SYP_ECOLI
6e-31
AC192956_2
278
1297
прямое
4
TALB_ECOLI
4e-150
AC192956_3
1432
2427
прямое
5
SYK3_ECOLI
5e-126
AC192956_6
6484
6999
прямое
2
INSH5_ECOLI
5e-40
AC192956_8
5963
5511
обратное
1
CODB_ECOLI
4e-04
Схема. Гипотетические гены в фрагменте 35001-42000 записи AC192956,
для которых нашлись сходные последовательности в E. coli.
-[-> TALB_ECOLI,278..1297]---
5'-[-> SYP_ECOLI,1..336]-------------[-> SYK3_ECOLI,1432..2427]----------------------------[-> INSH5_ECOLI,6484..6999]-3'
3'--------------------------------------------------------------[<- CODB_ECOLI,5963..5511]-----------------------------5'
Схема. Взаимное расположение генов в геноме E. coli,
гомологичных предполагаемым генам фрагмента из R. insecticola.
Таблица 2. Соответствие белков, генов и координат.
protein
gene
CDS
SYP_ECOLI
proS
complement(217057..218775)
TALB_ECOLI
tktB
2577656..2579659
SYK3_ECOLI
yjeA
4380191..4381198
INSH5_ECOLI
insH5
1428462..1431442*
CODB_ECOLI
codB
354146..355405
5'---------------------------------[-> CODB_ECOLI, 354146..355405]-----------------[-> INSH5_ECOLI, 1428462..1431442]-
3'-[<- SYP_ECOLI, 217057..218775]-------------------------------------------------------------------------------------
----[-> TALB_ECOLI, 2577656..2579659]----------------------[-> SYK3_ECOLI, 4380191..4381198]-3'
---------------------------------------------------------------------------------------------5'
Как видно из схем расположения генов, гены в R. Insecticola расположены относительно
близко друг
к другу, причем два из них перекрываются, что связано, вероятно, с ошибками при секвенировании,
а гены в E. Coli расположены достаточно далеко друг от друга. Возможно, можно предположить,
что организмы хоть и имеют гомологичные белки, но все же являются отдаленными родственниками,
так как видно, что гомологичные участки достаточно отличаются в расположении в геномах двух бактерий.
Скорей всего, это связано с миграцией генов, вставлением различных плазмид или с другими эволюционными процессами.
На самом деле, это не является достаточным условием.
В данном случае можно говорить лишь о возможной не консервативности данного участка.