EMBOSS

С помощью команды "entret embl:D89965" была получена запись мРНК Rattus norvegicus из банка данных EMBL. Далее, с помощью команды "getorf -minsize 30 -table 0 -find 1" был получен файл, содержащий трансляции всех рамок считывания. В результаты был получен следщующий файл.. Выравниванием с помощью программы "needle" было обнаружено, что пятый вариант полнгостью совпадает с CDS, указанным в исходном файле. Эта запись из банка данных EMBL ссылается на запись из SwissProt с идентификатором P0A7B8. Причём в SwissProt этот ген указывается как ген из Escherichia coli. Видимо при сиквенировании были прочтены не только гены крысы, но и гены кишечной палочки, что привело к ошибке. Которую в последствии исправили.

Для дальнейшей работы необходимо было скачать все записи алкогольдегидрогеназ, что было сделано командой "entret sw:"adh_*" ". Был получен следующий файл.. Из него, использую команду "infoseq -only -usa >> " была получена запись, содержащая только универсальные адреса этих последовательностей. Из них были выбраны заданные последовательности и из них сформирован файл для работы программы seqret. С её помощью был получен файл, содержащий последовательности данных алкогольдегидрогеназ в фаста-формате.

Для дальнейшей работы были выбраны алкогольдегидрогеназы со следующими идентификаторами : Q8NXU1 из Staphylococcus aureus и P86885 из Mesorhizobium australicum, это грамм-положительная и грамм-отрицательная бактерии. С помощью команды shuffleseq было получено 100 случайных перемешиваний последовательности Q8NXU1 и были проведены локальные парные выравнивения исходных последовательностей и последовательности P86885 с полученными перемешиваниями. Для всех выравниваний был посчитан Score этих выравниваний. распределение количества записей по score можно увидеть на рисунке 1. На нём видно, что score выравнивания последовательностей сильно отличается от score выравнивания с "перемешанными" последовательностями, из чего можно слделать вывод о гомологии данных последовательностей.

Гистограмма распределения выравниваний по их score Рис.1 Распределение количества выравниваний в зависимости от их score. Шаг для score был взят длиной в 4 единицы. Красным выделен столбик, содержащий выравнивание исследуемых последовательностей.
© Демкив Андрей 2013 Дата последнего изменения: 29.05.2015