Алгоритм |
Параметры |
Число находок | megablast | Стандартные; Исключен род Polycirrus , поиск в рамках семейства Terebellidae | 35 |
blastn | Стандартные; Исключен род Polycirrus , поиск в рамках семейства Terebellidae | 139 |
blastn | Word size: 7; Match/Mismatch Scores: 1, -4; Исключен род Polycirrus , поиск в рамках семейства Terebellidae | 149 (14 из которых имеют E value > 0,001) |
Рисунок 1. Результат megablast |
Рисунок 2. Результат default blastn |
Рисунок 3. Результат sensitive blastn |
На основании полученных результатов можно сделать вывод о том, что Megablast работает гораздо более строго, пересекая большее количество находок и, следовательно, выдавая только последовательности, которые ближе всего к исходной. Он подходит для поиска близкородственных последовательностей, работает довольно быстро. Blastn sensitive хорошо подходит для точного выравнивания высококонсервативных участков ДНК, а не целых генов. Таким образом, неудивительно, что выдача megablast наименьшая.
Алгоритм |
Параметры |
Число находок | megablast | Стандартные; Исключен род Polycirrus , поиск в рамках семейства Terebellidae; E-value < 0,001 | 0 |
blastn | Стандартные; Исключен род Polycirrus , поиск в рамках семейства Terebellidae; E-value < 0,001 | 0 |
blastn | Word size: 7; Match/Mismatch Scores: 1, -4; Исключен род Polycirrus , поиск в рамках семейства Terebellidae; E-value < 0,001 | 0 |
Были использованы последовательности тРНК AY863212.1 и рРНК AY863212.1 с различными параметрами. Общий параметр: поиск внутри семейства Terebellidae без рода Polycirrus. Бластование успехом не увенчалось.
Был проведён поиск гомологов трёх белков: HSP71_YEAST, шаперон HSP70, белок теплового шока; PRPC_EMENI, митохондриальная цитратсинтаза;TBB_NEUCR, тубулин, белок, участвующий в образовании микротрубочек. Поиск производился с помощью tblastn на kodomo. В качестве базы данных был использован неаннотированный геном Amoeboaphelidium protococcarum
Была создана локальная база данных с помощью команды "makeblastdb -in X5.fasta -dbtype nucl", а далее с помощью tblastn были определены кодируемые белки.
Из таблицы мы видим, что у нас есть 3 находки, принадлежащие scaffold-199, scaffold-96 и scaffold-423. Исходя из значений e-value и процента идентичности, последние 2 яляются гомологами и выполняют ту же функцию, что и исходный белок. Scaffols-199 имеет 2 участка, гомологичных исходному белку, но, так как длина второй части выравнивания очень мала, можем предположить, что она не оказывает влияния на функцию белка, а потому будем считать, что белок имеет 3 гомолога в данном неаннотированном геноме. |
На основании длины последовательности e-value и процента идентичности, мы не можем сделать однозначного вывода о том, что scaffold-693 и scaffold-15 являются гомологами нашего белка, но они определенного содержат гомологичные участки(причём одни и те же в сразу двух скэффолдах). |
На основании процента идентичности и e-value можно сделать вывод, что unplaced-665 и scaffold-26 являются гомологами нашего белка. |
Для поиска генов был выбран scaffold-6 длиной 53904 п.н. и использован алгоритм blastx.
Наибольшее сходство в результате работы blastx было найдено с геном, транскрипт которого: "5-methyltetrahydropteroyltriglutamate-homocysteine". Он присущ хитридиомицетам. S-methyltransferase"
В целом Bacillus subtilis strain SRCM103576 и Bacillus vallismortis strain DSM 11031 содержат схожий геном.
Однако мы можем наблюдать участки с делецией и инверсией, дупликацией.
Учебные реалии, или список семестров;
© Daniel Igumnov, 2018