Нуклеотидный blast | ||||||||||||||||||||||||||||||||||||||||||||
Задание 1. (Также процитировано в практикуме 7). С помощью нуклеотидного BLAST'а (BLASTN) была предпринята попытка установить, какому гену какого организма принадлежит последовательность, полученная в практикуме 6. Результат выглядит так: Как можно заметить, довольно большое количество полученных последовательностей имеют высокую степень сходства и исходной (E-value=0.0, уровень сходства 97-98%), но наиболее подходящими являются первые два результата (наивысший score). Следовательно, полученная в практикуме 6 последовательность, вероятнее всего, является геном 18S рибосомальной РНК лентеца Diphyllobothrium nihonkaiense (он же D. klebanovskii) - уровень сходства 98%, Query cover 99%, score 1348. Ближайшая находка из другого вида того же рода - Diphyllobothrium latum 18S ribosomal RNA gene, complete sequence: уровень сходства 97%, Query cover 99%, score 1344. Выравнивание лучших 10 находок с исходной последовательностью представлено здесь. | ||||||||||||||||||||||||||||||||||||||||||||
Задание 2.
| ||||||||||||||||||||||||||||||||||||||||||||
Задание 3.1
Для иллюстрации приведены выдачи blast'а для двух из пяти белков: | ||||||||||||||||||||||||||||||||||||||||||||
Часть IIЗадание 4.
Геномы всех вырусов были сохранены в одном fasta-файле. После этого
была создана база индексов blast для созданного fasta файла: makeblastdb -in tobamovirus.fasta -dbtype nucl. После этого был запущен tblastx, на вход которому был задан тот же самый fasta-файл:
tblastx -query tobamovirus.fasta -db tobamovirus.fasta -out tobamov.out -outfmt 7; на выход была получена таблица tobamov.out, из которой с помощью
скрипта были удалены неинформативные и слабо сходные находки. Для этого скрипт был запущен со следующими
параметрами: В результате был получен файл, преобразованный в excel-таблицу. Таблица была отсортирована по значению identity, длине выравнивания и его счёту (рис. 4-6). Как оказалось, находки с наибольшим процентом идентичных нуклеотидов, наибольшей длиной выравнивания и максимальным счетом представляют собой сходные участки трёх вирусов : KF477193.1, V01408.1 и DQ355023.1 - соответственно Tobacco mosaic virus, Tomato mottle mosaic virus и Bell pepper mottle virus. Полученные данные позволяют признать, что геномы этих трёх вирусов наиболее схожи. Назад к странице семестров | ||||||||||||||||||||||||||||||||||||||||||||
© Andrew Sigorskih,2015. |