Третий семестр

Главная



Задание 1
		#Получим запись заданного гена (мРНК версии) крысы в БД embl
entret embl:d89965 -auto
#Поиск всех рамок не короче 90 п.н. между старт и стоп-кодонами, результат запишем в файл d89965.fasta
getorf -minsize 90 -find 1 -sequence embl:d89965
#какой рамке соответствует занесённая в поле FT белковая последовательность?
blastp -query d89965.fasta -subject translation-FT.orf > alignment
#получим последовательность, на которую ссылается запись embl, запишем в файл hslv_ecoli.fasta
seqret sw:P0A7B8
#проверим, какой рамке соответствует запись SwissProt
blastp -query hslv_ecoli.fasta -subject trans.orf > alignment

Было обнаружено, что запись SwissProt и EMBL, во-первых, относятся к разным организмам (кишечной палочке и крысе, соответственно), а во-вторых, белки в этих двух БД транслируются с разных рамок. На лицо несоответствие.
Наверно, верна запись SwissProt, поскольку записи в нём проверяются тщательней. В записи EMBL имеется ссылка на публикацию: "Molecular cloning of a novel gene involved in serotonin receptor-mediated signal transduction in rat stomach", то есть мРНК была получена из желудка крысы, где могут быть и бактерии.
Скорее всего, исследователи, занимаясь изучением сигнальных путей крысы, просеквенировали мРНК бактерии и обнаружили на её рамке считывания заинтересовавший их белок.

Задание 2
		#Скачаем из SwissProt последовательности алкогольдегидрогеназ
seqret sw:adh*_* > adh_seq.fasta
#Создадим список со ссылками на эти последовательности
infoseq -only -usa adh_seq.fasta >list_adh
#Сузим этот список при помощи скрипта
chmod +x script.sh
./script.sh
#Получим последовательности из суженного списка
seqret @NEW_list_adh NEW_seqs_adh

Конечный файл с аминокислотными последовательностями алкогольдегидрогеназ из заданных организмов: NEW_seqs_adh.

Случайная модель для оценки достоверности выравнивания

Для выполнения следующего задания возьмем две произвольные алкогольдегидрогеназы: ADH1_DROMN и ADH4_HUMAN и построим их парное локальное выравнивание при помощи water c весом 65.5. Затем, при помощи команды shuffleseq sw:ADH1_DROMN -shuffle 100 DROMN_shuffle.fasta первая последовательность была 100 раз перемешана. Затем при помощи water было построено выравнивание второй последовательности с каждой из перемешанных, полученный файл можно скачать здесь. Был составлен список весов этих последовательностей и сравнен с весом первого выравнивания. Среди выравниваний с перемешанными последовательностями встречаются те, что имеют больший вес. Поэтому нельзя сделать вывод о гомологии последовательностей.

Рис. 1. Распределение весов выравниваний перемешанных последовательностей. Темнее столбик с весом неперемешанного выравнивания.




© Рябых Григорий, 2014

Последнее обновление: 16.09.2014