УЧЕБНЫЙ САЙТ АМОСОВОЙ АЛЁНЫ

Задание 1

Был получен контиг, в нем необходимо было найти открытые рамки считывания, используя один из двух вариантов. С помощью ORF-finder были найдены несколько рамок считывания. Из них были выбраны некоторые рамки, которые наиболее вероятно есть гены(выделены красным), т.е. им были найдены гомологи в swiss-prot. Желтыми были выделены рамки для которых были найдены неплохие, но далеко не полные покрытия, т.ч., вероятно, что гены здесь 2(красные рамки)


Не все рамки были проверены в swiss-prot, в расчете на неперекрываемость генов прокариот и на слишком слишком малый размер некоторых рамок.

Начало

Конец

Длина в а.о.

Цепь

Описание

1927

2853

927

+

Пермеаза

1293

1895

603

+

Фосфосерин фосфатаза

Далее поиск генов был осуществлен в Gene-Mark, и получен Gene-mark файл. Здесь были предсказаны 4 гены(все помеченные рамки из прошлого задания). Вот таблица, составленная на основе GeneMark(второй лист файла не представлен картинкой, но самый правый ген тянется до 2853 основания):

Начало

Конец

Длина в а.о.

Цепь

<1

451

408

+

624

1154

531

+

1293

1895

603

+

1927

2853

927

+




Были заммечены некоторые различия двух алгоритмов предсказания, во второй раз GeneMark объединил одну из рамок считывания, распознанную в ORF и самый левый ген(желтая рамка ORF) в один. Ей собственно и была присвоенна координата начала <1. В остальном различий не заметно.Можно еще отметить, что GeneMark обозначил за гены рамки, к которым в ORF хороших гомологов не нашлось, это конечно не ставит на них "крест". Т.О. GeneMark, видимо, не всегда может хорошо различить близкие рамки. А впрочем, данные были полученны практически одинаковые, и все же, оба этих сервиса следует использовать в купе.
© Амосова Алена. 2013 год