![]() Семестры Сайт ФББ МГУ Kodomo Wiki NCBI |
RanHummer personal web-siteEMBOSS Упражнения · seqret - несколько файлов в формате fasta собрать в единый файл. Здесь собраны все файлы записи Swissprot, начинающиеся на 00. Результат - ex1.fasta. · seqretsplit - один файл в формате fasta делится на несколько. Разделены все файлы записи Swissprot, начинающиеся на 00. Результат - ex2.txt. · seqret - также переводит выравнивание из fasta-формата в формат msf. Выравнивание из последовательностей лучших находок из 7-го практикума. Результат - ex3.msf · featcopy - переводит таблицу особенностей из формата gb в другой формат, здесь это gff. Был взят gb-файл последовательности гена с идентификатором I04169.1. Результат - ex4.gff. · transeq - транслирует данную нуклеотидную последовательность в 6 рамках. Результат - ex5.fasta. Сравните аннотации генов белков в одной хромосоме бактерии или археи с трансляциями длинных открытых рамок считывания Получение списка координат и ориентаций найденных открытых рамок с помощью infoseq Name: Mesorhizobium opportunistum WSM2075 AC: NC_015675 Одна кольцевая хромосома - последовательность в fasta-формате. Получение трансляций: getorf NC_015675.fasta -table 11 -minsize 180 -circular -find 0 Результат: nc_015675.orf. Получение списка координат и ориентаций: infoseq nc_015675.orf -nousa -notype -nopgc -noorganism -outfile nc_015675.txt Отсев информации осуществлялся с помощью python-скрипта Получить список аннотированных генов белков NC_015675.faa и NC_015675.ptt скачаны с зеркала NCBI. Отсев информации из .ptt-файла осуществлялся с помощью python-скрипта Результат: таблица аннотированных генов белков в формате Excel Обе таблицы были слиты. По результатам обзора выявлено много аннотированных белков, длины которых не сильно отличаются от таковых в ORF-ах, но начало смещено на три нуклеотида. Возможно, это связано с тем, что ORF ген - последовательность от стопа до стопа, а в Annotation - от старта трансляции до стопа. Тем не менее, есть множество примеров того, что предсказанные и реальные белки повершено не согласуются друг с другом. Рассмотрев выборку таких различий, я не пришел ни к каким определенным выводам, так как разница выглядит очень хаотичной. |