Для поиска использовался blastn с алгоритмом megablast, так как он больше всего подходит для поиска близких гомологов.
На рис.1 приведены находки с наибольшим весом. В качестве запроса использовалась консенсусная последовательность из 6 практикума.
Ссылка на консенсусную последовательность.
Ссылка на множественное выравнивание выбранных находок: alignment.
Рис.2 - Таксономия объекта
В этом задании нужно сравнить результаты трёх запусков BLAST: megablast, blastn с параметрами по умолчанию, blastn чувствительными настройками.
Нужно было исследовать последовательность из задания 1 и одну из CDS вируса из практикума 7. В таблице 1 приведены параметры запусков BLAST.
Program Selection | megablast | blastn (по умолчанию) | blastn (чувствительный) |
---|---|---|---|
Max target sequences | 1000 | 1000 | 1000 |
Short queries | + | + | + |
Expect threshold | 0.0001 | 0.0001 | 0.0001 |
Word size | 28 | 11 | 7 |
Max matches in a query range | 0 | 0 | 0 |
Match/Mismatch Scores | 1,-2 | 2,-3 | 1,-1 |
Gap Costs | Linear | Existence: 5 Extension: 2 | Existence: 0 Extension: 2 |
Filter | Low complexity regions | Low complexity regions | Low complexity regions |
Mask | For lookup table only | For lookup table only | For lookup table only |
Таксоны, в которых шел поиск для червя:
Palpata | Pseudoalteromonas virus | |
megablast | 33 | 3 |
---|---|---|
blastn по умолч. | 20 | 28 |
blastn чувствит. | 10 | 82 |
Megablast во всех случаях нашёл выравнивания с identity от 80%.
Разные параметры запуска blastn из-за высокой консервативности давали практически идентичные результаты для червя.
Для вируса megablast нашёл родственные вирусы, blastn добавил сборки бактерий, на которых данный фаг паразитирует,
и некоторое количество других, уже близко не связанных; изменение параметров только увеличило число этих «других».
ACTH_HUMAN | MYO6_HUMAN | RPC1_HUMAN | |
Файл выдачи | Актин | Миозин | Полимераза |
Количество находок | 16 | 10 | 8 |
Лучшая находка | scaffold-17 | scaffold-17 | scaffold-300 |
E-value лучшей находки | 0 | 1e-121 | 0 |
Identity лучшей находки | 92% | 35% | 52% |
Вес лучшей находки | 733 | 422 | 516 |
Покрытие | 99,2% | 58,96% | 62% |
Вывод о гомологичности находки | Функционально гомологична | Функционально негомологична | Функционально гомологична |
Не во всех трех случаях можно говорить о гомологичии с сохранением функциональности,
поскольку в 1 и 3 случаях имеются протяженные участки в выравниваниях,
где аминокислоты полностью совпадают, а во втором случае их намногот меньше и сама протяженность очень низкая,
поэтому очень сложно говорить о гомологичии (возможно сборка генома X5 неполная).