Практикум 8. Нуклеотидный BLAST

Организм: Calypte anna (колибри Анны, Anna's hummingbird)

1. Поиск гена δ-субъединицы АТФ-синтазы

В файле белковых последовательностей GCF_003957555.1_bCalAnn1_v1.p_protein.faa был найден белок, аннотированный как "ATP synthase subunit delta, mitochondrial" (идентификатор XP_030290512.1).

  • Идентификатор белка: XP_030321988.1
  • Нуклеотидная запись (контиг): NC_044273.1
  • Координаты: 5,085,435..5,088,958
Геномный браузер NCBI, ген ATP5F1D
Рисунок 1. Расположение гена ATP5F1D (δ-субъединица АТФ-синтазы)Calypte anna. Координаты: 5,085,435..5,088,958. Соседние гены: MIDN (миднолин), STK11 (серин/треонин-киназа 11).

2. Сравнение вариантов BLAST для поиска в удалённом таксоне

Calypte anna относится к вторичноротым (Deuterostomia). Согласно заданию, для сравнения выбрано семейство Пчёлы (Apoidea, taxid:34735) — представители первичноротых (Protostomia).

Поиск проводился по базе refseq_genomes

BLASTN (megablast)

При запуске BLASTN с параметрами по умолчанию находок не обнаружено. Это ожидаемо для сравнения столь далёких таксонов на уровне нуклеотидов.

TBLASTN

Поиск белковой последовательности δ-субъединицы по трансляции геномов пчёл дал 38 находок (по числу геномов).

TBLASTN Apoidea
Рисунок 3. Результаты TBLASTN. Графическое представление выравниваний, цвет отражает степень сходства. Таблица находок.

Вывод: Аминокислотная последовательность δ-субъединицы АТФ-синтазы консервативна даже между первично- и вторичноротыми, тогда как нуклеотидная последовательность за время дивергенции накопила множество синонимичных замен, что сделало поиск BLASTN неэффективным.

3. Поиск генов рРНК по далёкому гомологу (E. coli)

Для поиска рибосомальных РНК в геноме колибри использовались последовательности 16S и 23S рРНК Escherichia coli (штамм K-12).

# Индексация генома колибри makeblastdb -in GCF_003957555.1_bCalAnn1.v1_p_genomic.fna -dbtype nucl # Поиск 16S рРНК blastn -task blastn -query 16S_ecoli.fa -db GCF_003957555.1_bCalAnn1.v1_p_genomic.fna -out blastn_16S.out -outfmt 7 # Поиск 23S рРНК blastn -task blastn -query 23S_ecoli.fa -db GCF_003957555.1_bCalAnn1.v1_p_genomic.fna -out blastn_23S.out -outfmt 7

Результаты:

После фильтрации по E-value < 0.5 для 16S обнаружено 12 гомологов (всего 35), для 23S — 39 гомологов (всего 46)

Схема находок рРНК
Рисунок 4. Схема расположения гомологов 16S и 23S рРНК на контигах генома Calypte anna

Работа выполнена с использованием NCBI BLAST, Genome Browser, makeblastdb.