Рис. 1. Вывод программы ORF Finder для выданного мне контига.
Как видно, найдено много котингов длиной более 60 а.о., то есть более 180 нуклеотидов. Далее без каких-либо изменений был проведен бласт всех последовательностей.| Начало | 1527 | 192 | 653 | 1185 |
| Конец | 2738 | 683 | 988 | 1466 |
| Длина в а.о. | 403 | 163 | 111 | 93 |
| Цепь | + | + | + | + |
| Описание | Цистиен десульфураза | Рибосомальный белок L11 - метилтрансфераза | 16S рРНК метилтрансфераза | 16S рРНК метилтрансфераза |
Таблица 1. Результаты анализа ORF Finder + Blast.
При бласте были использованы следующие параметры: E-value < 0.001, Coverage > 80%, база - SwissProt.
Рис. 2. Часть результатов бласта четвертой рамки.
Рис. 3. Часть кодирующего потенциала GeneMark с параметрами 1999 г.
Полностью потенциал можно посмотреть в файле .
GeneMark.hmm PROKARYOTIC (Version 3.25)
Date: Mon Nov 17 13:49:51 2014
Sequence file name: seq.fna
Model file name: /home/genemark/bin/gmsuite/heu_11.mod
RBS: false
Model information: Heuristic_model_for_genetic_code_11_and_GC_55
FASTA definition line: empty-fasta-def-line
Predicted genes
Gene Strand LeftEnd RightEnd Gene Class
# Length
1 + <3 683 681 1
2 + 701 988 288 1
3 + 1185 1466 282 1
4 + 1527 2738 1212 1
5 + 2821 >2940 120 1
Текстовый вывод GeneMark
Теперь можно наглядно сравнить предсказания. Первая находка GM (сокр. GeneMark) почти совпадает с 4 ORF из OF, за исключением смещения. Вторая совпадает с 8, но смещенная. Третья полностью совпадает с 12 из OF, но Blast не подтверждает эти данные. Четвертая совпадает с 1 из OF, для неё Blast дает множество гомологов. И наконец пятая совпадает с 17 полностью, но Blast не находит гомологов в принципе. В итоге, если анализировать оба подхода, то они практически совпадают в рамках первой и четвертой, которые действительно, согласно бласту, содержат белки.| Номер находки в GeneMark | 1 | 2 | 3 | 4 | 5 |
| Номер находки в OF | 4 | 8 | 12 | 1 | 17 |
| Координаты в GeneMark | <3...683 | 701...988 | 1185...1466 | 1527...2738 | 2821....>2940 |
| Координаты в OF | 192...683 | 653...988 | 1185...1466 | 1527...2738 | 2821...2939 |
| Совпадение по 10-ти балльной шкале | 6 | 8 | 10 | 10 | 10 |
GeneMark.hmm PROKARYOTIC (Version 3.25)
Date: Mon Nov 17 14:12:13 2014
Sequence file name: seq.fna
Model file name: /home/genemark/bin/gmsuite/MetaGeneMark_v1.mod
RBS: false
Model information: Heuristic_model_for_genetic_code_11_and_GC_55
FASTA definition line: empty-fasta-def-line
Predicted genes
Gene Strand LeftEnd RightEnd Gene Class
# Length
1 + <3 683 681 1
2 + 701 988 288 1
3 + 1185 1466 282 1
4 + 1515 2738 1224 1
5 + 2821 >2940 120 1
Текстовый вывод GeneMark
Выходной файл: файл.
Рис. 4. Часть кодирующего потенциала для GeneMark с параметрами 2010 г.
Исходя из выводов, видно, что в результате лишь съехало начало 4 рамки на 12 нуклеотидов, а все остальное осталось, как и было.Просвиров Кирилл. Дата последнего изменения: 4 октября 2014.