Назад на страницу семестра
Для анализа последовательности использовались blastn, blastx и tblastx. Использовались параметры по умолчанию, кроме:
Среди 100 первых находок каждой из трёх программ все являются либо полным митохондриальным геномом, либо геном или белком субъединицы 1 цитохромоксидазы. При этом низкие значения E-value (10^-120 и ниже) и высокие значения идентичности (подробнее - ниже) позволяют с большой уверенностью говорить о том, что исследуемая последовательность относится к гену COI.
При этом из выдачи blastx видно, что транслированная последовательность, как правило, выравнивается с аминокислотами с 5 по [220-240] полных белков, которые, в свою очередь, состоят из около 500 аминокислот, что говорит о том, что нам дан фрагмент гена COI с одним экзоном - не первым и не последним.
Поскольку цитохромоксидаза довольно консервативна, устанавливать таксономию корректнее по выдаче blastn, т.к. предполагается большая доля синонимических мутаций в её гене, не приводящих к различиям белков. Наибольший счёт и процент идентичности (до 99.58% по сравнению с идентичностью не выше 83.56% у остальных находок - для проверки этого был проведён повторный поиск с отображением 5000 последовательностей, который выявил 1751) имеют фрагменты CDS COI брюхоногого моллюска Alderia modesta.
Даже с учётом того, что большинство находок из A. modesta имеют покрытие запроса всего 65%, они лидируют по счёту (до 878 против 623 у первой находки из другого организма), что позволяет утверждать, что A. modesta - источник последовательности.
Рассматриваемый скэффолд Ananas comosus.
Использовалась blastx. Поиск ограничен однодольными, кроме A. comosus.
Нуклеотиды примерно с 6726 до 3384 (на обратной цепи), скорее всего, кодируют белок устойчивости к болезням, т.к. E-value для белков устойчивости к болезням (как предполагаемых, так и тех, функция которых установлена) других растений указан как 0.0; идентичность достигает 40-47%.
На карте локального сходства видно две крупные инверсии: в районе 1.25-1.90 мб (в геноме E. coli, здесь и далее) и в районе 3.75-4.20 мб. Также присутствуют делеции в геноме E. marmotae или инсерции в E. coli, например, на участках с координатами 2.8 мб, 4.5 мб.