Практикум 8. Нуклеотидный BLAST
Организм: Calypte anna (колибри Анны, Anna's hummingbird)
1. Поиск гена δ-субъединицы АТФ-синтазы
В файле белковых последовательностей GCF_003957555.1_bCalAnn1_v1.p_protein.faa был найден белок, аннотированный как "ATP synthase subunit delta, mitochondrial" (идентификатор XP_030290512.1).
- Идентификатор белка: XP_030321988.1
- Нуклеотидная запись (контиг): NC_044273.1
- Координаты: 5,085,435..5,088,958
2. Сравнение вариантов BLAST для поиска в удалённом таксоне
Calypte anna относится к вторичноротым (Deuterostomia). Согласно заданию, для сравнения выбрано семейство Пчёлы (Apoidea, taxid:34735) — представители первичноротых (Protostomia).
Поиск проводился по базе refseq_genomes
BLASTN (megablast)
При запуске BLASTN с параметрами по умолчанию находок не обнаружено. Это ожидаемо для сравнения столь далёких таксонов на уровне нуклеотидов.
TBLASTN
Поиск белковой последовательности δ-субъединицы по трансляции геномов пчёл дал 38 находок (по числу геномов).
Вывод: Аминокислотная последовательность δ-субъединицы АТФ-синтазы консервативна даже между первично- и вторичноротыми, тогда как нуклеотидная последовательность за время дивергенции накопила множество синонимичных замен, что сделало поиск BLASTN неэффективным.
3. Поиск генов рРНК по далёкому гомологу (E. coli)
Для поиска рибосомальных РНК в геноме колибри использовались последовательности 16S и 23S рРНК Escherichia coli (штамм K-12).
Результаты:
- blastn_16S.out (таблица)
- blastn_23S.out (таблица)
После фильтрации по E-value < 0.5 для 16S обнаружено 12 гомологов (всего 35), для 23S — 39 гомологов (всего 46)
Работа выполнена с использованием NCBI BLAST, Genome Browser, makeblastdb.