EMBOSS
Отредактировано 22/09/13
EMBOSS Программа getorf пакета EMBOSS С помощью команды entret embl:d89965 был создан файл с записью D89965 банка EMBL. При запуске программы getorf были подобраны параметры, которые помогали получить набор трансляций всех открытых рамок данной последовательности, которые определены при использовании стандартного кода и одновременно выполняют требуемым условиям, а именно:
getorf -minsize 90 -find 1 -table 0 таким образом была задана минимальная длина orf (90 нуклеотидов), был выбран стандартный генетический код (парамерт –table 0), а начала со старт-кодона и окончание на стоп-кодоне определяется параметром –find 1. Были получены пять последовательностей рамок считывания (файл). Из них 3ая последовательность соответствует приведенной в поле FT кодирующей последовательности (CDS). Она приведена в файле hslv_ecoli.fasta Был создан файл с последовательностью записи Swiss-Prot, на которую ссылается данная запись EMBL. Эта последовательность соответствует рамке под номером пять. Наблюдается следующая ситуация: на запись в Swiss-Prot ссылается рассматриваемая запись EMBL. Но две записи, которые идентичны, относятся не просто к разным организмам, а к достаточно далеким организмам: бактерии E. coli и млекопитающему Rattus norvegicus. Одной из предположительных причин такого результата можно считать предположительное наличие бактериальной ДНК в препарате мРНК из желудка крысы. Поэтому исследуемый белок принадлежит E. coli, а не крысе. Белок закодирован на пятой рамке у E. coli, а третья рамка у Rattus norvegicus – некодирующая. Файлы-списки С помощью команды seqret sw:adh*_* adh.fasta в файл adh.fasta скачиваем в fasta-формате все доступные в Swissprot последовательности алкогольдегидрогеназ. С помощью команды infoseq -only -usa > usalist.txt был получен файл с универсальными адресами (USA) последовательностей. Из этого файла-списка с помощью команды grep -f organ.txt usalist.txt > needs.txt был получен другой, меньший файл, с адресами только тех последовательностей, которые взяты из определенного набора организмов. На основе нового файла-списка с помощью команды seqret @needs.txt needs.fasta был получен fasta-файл с последовательностями дегидрогеназ выбранных организмов. EnsEMBL С помощью портала EnsEMBL, который предназначен для визуализации известной информации о геномах человека и животных, был проведен поиск информации о гене MOAP1_HUMAN. На запрос по данному гену было получено 3 результата. О самом гене можно найти различную информацию: расположение, длину, координаты, экзон-интронную структуру, аннотации гена и белка и многое другое. Еще есть список экзонов и их координат. Кроме того, можно наглядно увидеть полный геном человека (Рис.1). Ген относится к 14 хромосоме (Рис.2). Отдельные экзоны рассматриваются как хиты. Можно посмотреть регион отдельного хита (Рис.3) Можно получить изображение локуса (Рис.4) |
|
© Малеева Александра
|