Семестры
Сайт ФББ МГУ
Kodomo Wiki
NCBI

RanHummer personal web-site


EMBOSS

Упражнения

·         seqret - несколько файлов в формате fasta собрать в единый файл. Здесь собраны все файлы записи Swissprot, начинающиеся на 00. Результат - ex1.fasta.

·         seqretsplit - один файл в формате fasta делится на несколько. Разделены все файлы записи Swissprot, начинающиеся на 00. Результат - ex2.txt.

·         seqret - также переводит выравнивание из fasta-формата в формат msf. Выравнивание из последовательностей лучших находок из 7-го практикума. Результат - ex3.msf

·         featcopy - переводит таблицу особенностей из формата gb в другой формат, здесь это gff. Был взят gb-файл последовательности гена с идентификатором I04169.1. Результат - ex4.gff.

·         transeq - транслирует данную нуклеотидную последовательность в 6 рамках. Результат - ex5.fasta.

Сравните аннотации генов белков в одной хромосоме бактерии или археи с трансляциями длинных открытых рамок считывания

Получение списка координат и ориентаций найденных открытых рамок с помощью infoseq

Name: Mesorhizobium opportunistum WSM2075

AC: NC_015675

Одна кольцевая хромосома - последовательность в fasta-формате.

Получение трансляций: getorf NC_015675.fasta -table 11 -minsize 180 -circular -find 0

Результат: nc_015675.orf.

Получение списка координат и ориентаций: infoseq nc_015675.orf -nousa -notype -nopgc -noorganism -outfile  nc_015675.txt

Отсев информации осуществлялся с помощью python-скрипта

Получить список аннотированных генов белков

NC_015675.faa и NC_015675.ptt скачаны с зеркала NCBI.

Отсев информации из .ptt-файла осуществлялся с помощью python-скрипта

Результат: таблица аннотированных генов белков в формате Excel

Обе таблицы были слиты. По результатам обзора выявлено много аннотированных белков, длины которых не сильно отличаются от таковых в ORF-ах, но начало смещено на три нуклеотида. Возможно, это связано с тем, что ORF ген - последовательность от стопа до стопа, а в Annotation - от старта трансляции до стопа. Тем не менее, есть множество примеров того, что предсказанные и реальные белки повершено не согласуются друг с другом. Рассмотрев выборку таких различий, я не пришел ни к каким определенным выводам, так как разница выглядит очень хаотичной.


© Поляков Игорь aka RanHummer