EMBOSS: пакет программ для анализа последовательностей

Третий семестр Главный сайт



Задание 1

Для рассмотрения я взял хромосому бактерии Xanthobacter autotrophicus Py2
Хромосома бактерии в базе данных NCBI
 При помощи команды "getorf NC_009720.fna -table 11 -minsize 180 -circular -find 0 > nc_009720.orf" 
(-table 11 - генетический код бактерий, -minsize 180 - минимальный размер рамки, -circular - ДНК кольцевая,
-find 0  - от стоп-кодона до стоп-кодона) был получен список открытых рамок.
Список открытых рамок

При помощи команды"infoseq nc_009720.orf -name -only -sprotein1 -length -description > xanth_coord"
таблица рамок была сведена к таблице координат их начал и концов.
Таблица координат
Затем эта таблица и таблица аннотированных рамок были приведены к общему формату
и сведены в одну (с тремя листами: ORF - полученные рамки, ANNOT - аннотированные). 

Задание 2

Таблица аннотированных рамок

Задание 3

Объединенные таблицы
	

 Особенности:
1: Ген без какой-либо подходящей рамки.
2 и 2'. Ген и соответствующая ему рамка.
3 и 3', 4 и 4'. Два гена, которые на ровно 3 пары оснований длиннее подходяших им рамок. Таких генов довольно много.  
 
В области длинных генов, где на ген приходится почти всегда одна рамка сдвиг на 3 праы оснований появляется с завидной 
регулярностью. Это обусловлено тем, что найденые рамки включают в себя стопкодон, с которого стартуют. 
 
Накладывающиеся гены на противоположенных цепях.  

Сайт находится в стадии разработки


© 2014 Рюмин Константин