Учебный сайт Светланы Яровенко
» Семестры » Третий семестр » EMBOSS

EMBOSS

С помощью команды entret embl:D89965 был получен файл d89965.entret с записью D89965 банка EMBL. В данной записи содержится нуклеотидная последовательность мРНК из Rattus norvegicus. Белок, который кодируется этой мРНК, связан с серотониновым рецептором крысы, секретируемщимся в желудке.

С помощью программы getorf получен набор трансляций всех открытых рамок считывания из данной последовательности: getorf -minsize 30 -table 0 -find 1 embl:d89965. Полученные рамки определены при использовании стандартного генетического кода, имеют длину не менее 30 аминокислотных остатков, начинаются со старт-кодона и заканчиваются стоп-кодоном. В итоге получился файл d89965.orf.

Пятая из найденных открытых рамок частично соответствует приведённой в поле FT кодирующей последовательности (CDS). Нижу приведена её аминокислотная последовательность:

>D89965_5 [163 - 432] Rattus norvegicus mRNA for RSS, complete cds.
MALMHFQFTFKQFEQRKSIRSTARKARDDFVVVQTADLFHVAFHYGIAQRGLTITSDDHM
AVTAYAYYSCHELTPWLRIQSTNPVQKYGA

Координаты начала этих последовательностей совпадают (163), но координаты конца отличаются на 3 нуклеотида. Вероятней всего, это связано с тем, что CDS включает в себя стоп-кодон, а найденная с помощью getorf рамка считывания - нет.


Данная запись EMBL ссылается на запись Swiss-Prot с идентификатором P0A7B8. С помощью команды span style="font-family: Courier New;">entret sw:P0A7B8 мы получаем файл hslv_ecoli.entret с записью Swiss-Prot. Чтобы найти рамку считывания, соответствующую этой последовательности, была запущена программа needle: needle sw:P0A7B8 d89965.orf. В итоге, лучше всего последовательность выравнялась с 9 рамкой. Файл с остальными парными выравниваниями: hslv_ecoli.needle.


Запись P0A7B8 банка Swiss-Prot соответствует белку бактерии Escherichia coli, а последовательность соответствующей записи EMBL — мРНК серой крысы. Вероятней всего белок был получен не из клетки крысы, а из клетки бактерии, которая жила в ней.



С помощью команды entret sw:adh*_* adh.fasta был получен файл всех алкогольдегидрогеназ adh.fasta. Далее с помощью программы infoseq и команды infoseq adh.fasta -only -usa -out list.txt мы получили файл-список list.txt с универсальными адресами (USA) последовательностей из предыдущего файла.

В файле my.txt находится список, доставшихся мне организмов: DROMY, MESAU, ENTHI, STAAR, MYXGL, METMP, HUMAN. Используя команду grep -f my.txt list.txt > ad_usa.txt, удалось получить файла-список ad_usa.txt с адресами только этих последовательностей. На его основе был получен fasta-файл seq.fasta с последовательностями дегидрогеназ этих организмов: seqret @ad_usa.txt seq.fasta.



Для дальнейшей работы были взяты алкогольдегидрогеназа из Entamoeba histolytica (дизентирийной амёбы) и алкогольдегидрогеназа человека. По ним была проведена оценка достоверности вывода об их гомологии. Для этого с помощью программы shuffleseq (команда shuffleseq enthi.fasta) было сгенерировано 100 случайных перемешиваний последовательности Entamoeba histolytica — файл shuf_enthi.fasta. Программа water построила выравнивания последовательности из человека с последовательностью из Entamoeba histolytica, а также с каждой "перемешанной". Вес для выравнивания "реальных" последовательностей — 57, файл с парными выравниваниями — adh6_human.water. С помощью команды grep '# Score:' adh6_human.water | sed 's/# Score: //g' > scores.txt был получен файл scores.txt с весом для 100 выравниваний перемешанных последовательностей. Используя эти данные, в Excel была построена гистограмма, представленная на Рисунке 1. Вес был предварительно упорядочен по возрастанию.

А-форма ДНК

Рисунок 1. Распределение весов 101 парного выравнивания.
На горизонтальной оси отложен вес выравниваний. Фиолетовым выделено значение, соответствующее выравниванию "реальных" последовательностей. Судя по гистограмме, белки негомологичны, так как вес выравниваний некоторых случайных последовательностей оказался гораздо больше, чем вес оригинального выравнивания.
Рисунок получен с помощью программы Excel.



Наверх