НА ГЛАВНУЮ
Предсказание генов во фрагменте генома
бактерии Yersinia bercovieri
Из последовательности, содержащей неаннотированные фрагменты генома бактерии Yersinia bercovieri был получен нужный фрагмент следующей командой: seqret yb.fasta:AALC01000086 -saskОстальные параметры (начало и конец фрагмента) были указаны в диалоговом режиме. Далее командой wossname ORFбыли найдены программы, позволяющие искать открытые рамки считывания (open reading frames) в нуклеотидных последовательностях. Испробовав каждую из них, я пришёл к выводу, что больше всего мне подходит программа getorf . Трансляции всех открытых рамок считывания длиной не менее getorf -sequence yb.4001-8000.fasta -minsize 240 -table bacterial -find 1 -outseq yb_4001-8000.orf.fastaЗатем были получены все последовательности SwissProt из бактерий таксона Enterobacteriales : seqret sw-org:enterobacteriales fasta::entero.sw.fastaи по ним созданы индексные файлы Blast: formatdb -i entero.sw.fasta -p F -n enteroЧисло последовательностей Enterobacteriales, сходных с найденными ORF'ами, было подсчитано программой BLASTP с помощью скрипта. Информация об открытых рамках считывания
|
Начало во фрагменте | Конец во фрагменте | Направление | Число сходных последовательностей среди Enterobacteriales (E-value < 0,01, BlastP) | |
AALC01000086_1 | 1 | 378 | прямое | 0 |
AALC01000086_2 | 1010 | 1255 | прямое | 0 |
AALC01000086_3 | 769 | 1773 | прямое | 6 |
AALC01000086_4 | 2633 | 2950 | прямое | 0 |
AALC01000086_5 | 3498 | 3998 | прямое | 7 |
AALC01000086_6 | 3305 | 2838 | обратное | 3 |
AALC01000086_7 | 2782 | 1856 | обратное | 6 |
AALC01000086_8 | 1701 | 1300 | обратное | 0 |
AALC01000086_9 | 1105 | 842 | обратное | 0 |
AALC01000086_10 | 1046 | 768 | обратное | 0 |
Схематическое изображение предполагаемых генов (открытых рамок, имеющих гомологов):
...--769---------->1773--... ...--3498----->3998--... ...--1856<---------2782-...-2838<-----3305--...