НА ГЛАВНУЮ

Предсказание генов во фрагменте генома
бактерии Yersinia bercovieri

Из последовательности, содержащей неаннотированные фрагменты
генома бактерии Yersinia bercovieri был получен нужный фрагмент
следующей командой:
 seqret yb.fasta:AALC01000086 -sask 
Остальные параметры (начало и конец фрагмента) были указаны
в диалоговом режиме.

Далее командой

 wossname ORF 
были найдены программы, позволяющие искать открытые рамки
считывания (open reading frames) в нуклеотидных последовательностях.
Испробовав каждую из них, я пришёл к выводу, что больше всего мне
подходит программа getorf .

Трансляции всех открытых рамок считывания длиной не менее
240 нуклеотидов были получены командой

 getorf -sequence yb.4001-8000.fasta -minsize 240 -table bacterial -find 1 -outseq yb_4001-8000.orf.fasta 
Затем были получены все последовательности SwissProt из
бактерий таксона Enterobacteriales :
 seqret sw-org:enterobacteriales fasta::entero.sw.fasta 
и по ним созданы индексные файлы Blast:
 formatdb -i entero.sw.fasta -p F -n entero 
Число последовательностей Enterobacteriales, сходных с найденными
ORF'ами, было подсчитано программой BLASTP с помощью скрипта.

Информация об открытых рамках считывания
в моём фрагменте генома.

  Начало
во фрагменте
Конец
во фрагменте
Направление Число сходных последовательностей
среди Enterobacteriales
(E-value < 0,01, BlastP)
AALC01000086_1 1 378 прямое 0
AALC01000086_2 1010 1255 прямое 0
AALC01000086_3 769 1773 прямое 6
AALC01000086_4 2633 2950 прямое 0
AALC01000086_5 3498 3998 прямое 7
AALC01000086_6 3305 2838 обратное 3
AALC01000086_7 2782 1856 обратное 6
AALC01000086_8 1701 1300 обратное 0
AALC01000086_9 1105 842 обратное 0
AALC01000086_10 1046 768 обратное 0

Схематическое изображение предполагаемых генов (открытых рамок, имеющих гомологов):

 ...--769---------->1773--...                     ...--3498----->3998--...
                ...--1856<---------2782-...-2838<-----3305--...