emboss

Задание 1

		#Получим запись заданного гена (мРНК версии) крысы в БД embl
 
		entret embl:d89965 -auto

		#Поиск всех рамок не короче 90 п.н. между старт и стоп-кодонами, результат запишем в файл d89965.fasta

		getorf -minsize 90 -find 1 -sequence embl:d89965

		#какой рамке соответствует занесённая в поле FT белковая последовательность?

		blastp -query d89965.fasta -subject translation-FT.orf > alignment

		#получим последовательность, на которую ссылается запись embl, запишем в файл hslv_ecoli.fasta

		seqret sw:P0A7B8

		#проверим, какой рамке соответствует запись SwissProt

		blastp -query hslv_ecoli.fasta -subject trans.orf > alignment

Было обнаружено, что запись SwissProt и EMBL, во-первых, относятся к разным организмам (кишечной палочке и крысе, соответственно), а во-вторых, белки в этих двух БД транслируются с разных рамок. На лицо несоответствие.
Наверно, верна запись SwissProt, поскольку записи в нём проверяются тщательней. В записи EMBL имеется ссылка на публикацию: "Molecular cloning of a novel gene involved in serotonin receptor-mediated signal transduction in rat stomach", то есть мРНК была получена из желудка крысы, где могут быть и бактерии.
Скорее всего, исследователи, занимаясь изучением сигнальных путей крысы, просеквенировали мРНК бактерии и обнаружили на её рамке считывания заинтересовавший их белок.

Задание 2

		#Скачаем из SwissProt последовательности алкогольдегидрогеназ

		seqret sw:adh*_* > adh_seq.fasta

		#Создадим список со ссылками на эти последовательности

		infoseq -only -usa adh_seq.fasta >list_adh

		#Сузим этот список при помощи скрипта

		chmod +x script.sh

		./script.sh

		#Получим последовательности из суженного списка

		seqret @NEW_list_adh NEW_seqs_adh

Конечный файл с аминокислотными последовательностями алкогольдегидрогеназ из заданных организмов: NEW_seqs_adh.

Случайная модель для оценки достоверности выравнивания

Для выполнения следующего задания возьмем две произвольные алкогольдегидрогеназы: ADH1_DROMN и ADH4_HUMAN и построим их парное локальное выравнивание при помощи water c весом 65.5. Затем, при помощи команды shuffleseq sw:ADH1_DROMN -shuffle 100 DROMN_shuffle.fasta первая последовательность была 100 раз перемешана. Затем при помощи water было построено выравнивание второй последовательности с каждой из перемешанных, полученный файл можно скачать здесь. Был составлен список весов этих последовательностей и сравнен с весом первого выравнивания. Среди выравниваний с перемешанными последовательностями встречаются те, что имеют больший вес. Поэтому нельзя сделать вывод о гомологии последовательностей.

Рис. 1. Распределение весов выравниваний перемешанных последовательностей. Темнее столбик с весом неперемешанного выравнивания.

Последнее обновление: 16.09.2014