• Главная
  • Обо мне
  • Семестры
    Семестр 1
    Семестр 2
    Семестр 3
    Семестр 4
    Семестр 5
    Семестр 6
  • Проекты
  • Заметки
  • Ссылки
EMBOSS Отредактировано 22/09/13
Семестр 1
Семестр 2
Семестр 3
Семестр 4
Семестр 5
Семестр 6

EMBOSS



Программа getorf пакета EMBOSS

С помощью команды entret embl:d89965 был создан файл с записью D89965 банка EMBL.

При запуске программы getorf были подобраны параметры, которые помогали получить набор трансляций всех открытых рамок данной последовательности, которые определены при использовании стандартного кода и одновременно выполняют требуемым условиям, а именно:


  • При запуске программы getorf были подобраны параметры, которые помогали получить набор трансляций всех открытых рамок данной последовательности, которые определены при использовании стандартного кода и одновременно выполняют требуемым условиям, а именно:
  • начинается со старт-кодона (или начала последовательности) и заканчиваются стоп-кодоном (или концом последовательности).

getorf -minsize 90 -find 1 -table 0 таким образом была задана минимальная длина orf (90 нуклеотидов), был выбран стандартный генетический код (парамерт –table 0), а начала со старт-кодона и окончание на стоп-кодоне определяется параметром –find 1.

Были получены пять последовательностей рамок считывания (файл). Из них 3ая последовательность соответствует приведенной в поле FT кодирующей последовательности (CDS). Она приведена в файле hslv_ecoli.fasta

Был создан файл с последовательностью записи Swiss-Prot, на которую ссылается данная запись EMBL. Эта последовательность соответствует рамке под номером пять.

Наблюдается следующая ситуация: на запись в Swiss-Prot ссылается рассматриваемая запись EMBL. Но две записи, которые идентичны, относятся не просто к разным организмам, а к достаточно далеким организмам: бактерии E. coli и млекопитающему Rattus norvegicus.

Одной из предположительных причин такого результата можно считать предположительное наличие бактериальной ДНК в препарате мРНК из желудка крысы. Поэтому исследуемый белок принадлежит E. coli, а не крысе.

Белок закодирован на пятой рамке у E. coli, а третья рамка у Rattus norvegicus – некодирующая.


Файлы-списки


С помощью команды seqret sw:adh*_* adh.fasta в файл adh.fasta скачиваем в fasta-формате все доступные в Swissprot последовательности алкогольдегидрогеназ.

С помощью команды infoseq -only -usa > usalist.txt был получен файл с универсальными адресами (USA) последовательностей.

Из этого файла-списка с помощью команды grep -f organ.txt usalist.txt > needs.txt был получен другой, меньший файл, с адресами только тех последовательностей, которые взяты из определенного набора организмов.

На основе нового файла-списка с помощью команды seqret @needs.txt needs.fasta был получен fasta-файл с последовательностями дегидрогеназ выбранных организмов.


EnsEMBL

С помощью портала EnsEMBL, который предназначен для визуализации известной информации о геномах человека и животных, был проведен поиск информации о гене MOAP1_HUMAN.

На запрос по данному гену было получено 3 результата.

О самом гене можно найти различную информацию: расположение, длину, координаты, экзон-интронную структуру, аннотации гена и белка и многое другое. Еще есть список экзонов и их координат.

Кроме того, можно наглядно увидеть полный геном человека (Рис.1).


Ген относится к 14 хромосоме (Рис.2). Отдельные экзоны рассматриваются как хиты.


Можно посмотреть регион отдельного хита (Рис.3)


Можно получить изображение локуса (Рис.4)



© Малеева Александра