Практикум 8

Ген морской звезды, кодирующий δ-субъединицу АТФ-синтазы

Был произведен поиск в файле последовательностей белков последовательности δ-субъединицы АТФ-синтазы по запросу: ATP synthase subunit delta. Идентификатор данного белка: XP_033636179.1 ATP synthase subunit delta, mitochondrial-like [Asterias rubens].

Файл с последовательностью δ-субъединицы АТФ-синтазы.

Далее был произведен поиск в нуклеотидной последовательности генома (искали идентификатор записи нуклеотидной последовательности дельта-субъединицы АТФ-синтазы). Идентификатор нуклеотидной записи: NC_047073. Ген, в котором содержится последовательность дельта-субъединицы ATP5F1D.

Файл с окрестностью гена ATP5F1D.

Рис. 1. Изображение окрестности гена.

Сравнение находок разных алгоритмов BLAST

Так как морские звезды (Asterias rubens) относится к вторичноротым, рассмотрим находки по фрагментам ДНК первичноротых, а именно Пауки (Araneae).

База данных для поиска: refseq_genomes.

Число сборок в ней, входящих в выбранный таксон: 29 (число геномов, по которым проводился поиск).

1) По поиску в tblastx найдено 4 находки, в среднем 55% идентичности, учитывая, что Пауки от Морских звезд далеки, то подобный рзультат указывает на недостаточно хорошую консервативность последовательности гена, кодирующего дельта субъединицу АТФ-синтазы. В целом такое небольшое количество находок и ожидалось со стандартными параметрами BLAST.

Файл выдачи tblastx

2) Поиск по алгоритму megablast с длиной слова 28 выдало 2 находки, 73.20% и 91.89% идентичности. Такой результат предполагает, что найденные последовательности имеют относительно высокий уровень идентичности с искомой, но при этом могут быть различия в отдельных сегментах. При идентичности 91.89% длина выравнивания 37 (в нуклеотидах), а его e-value незначителен (0.03). В целом в окрестностях этого числа находок и был ожидаемый результат.

Файл выдачи megablast

Поиск в геноме генов основных рибосомальных РНК по далекому гомологу

Команда для индексации генома:

makeblastdb -in GCF_902459465.1_eAstRub1.3_genomic.fna -dbtype nucl

Проводим поиск BLAST по 16S и 23S рРНК E.coli

Приведем описания этих РНК:

16S рРНК - формирует структуру рибосомы, учавствует в распознавании последовательности Шайна-Дальгарно и свойственна прокариотам, расположена в малой субьединице рибосомы.

23S рРНК - расположена в большой субьединице бактериальной или архейной рибосомы, учавствует в инициации и элонгации трансляции, имеет каталитическую активность и помогает поддерживать структуру рибосомы, используются в филогенетике в виду высококонсервативности.

Был использован blastn, так как нужно было сравнить нуклеотидные последовательности неблизкородственных организмов. В качестве парметров: evalue 0.05 (чтобы отсеять плохие находки), а также outfmt 7 (чтобы получить результаты в виде таблицы с комментариями).

Команды:

blastn -task blastn -evalue 0.05 -query 16S.txt -db GCF_902459465.1_eAstRub1.3_genomic.fna -out blastn_16S.txt -outfmt 7

blastn -task blastn -evalue 0.05 -query 23S.txt -db GCF_902459465.1_eAstRub1.3_genomic.fna -out blastn_23S.txt -outfmt 7

Результаты выполнения команд:

16S рРНК

23S рРНК

Как можно увидеть для 16S рРНК было найдено 3 хитa (3 гомолога).

Для 23S рРНК было найдено 5 хитов. Участок запроса 428-527 выравнивается на координаты 10526094-10525995, участок запроса 221-290 выравнивается на координаты 10526368-10526300, участок 1879-1941 на соседние 10523599-10523537, участки 2234-2267 и 2442-2613 на 10518687-10518654 и 10518478-10518307 соответственно. Так как координаты довольно близки, можно сделать вывод, что гомолог 1. Координаты на запросе возрастают, а цепи убывают, это означает, что гомолог находится на комплементарной цепи по отношению к той, которая лежит в базе данных.

Видимо, их несколько, так как у эукариот есть ещё и митохондриальные рибосомы 70S, помимо основных рибосом типа 80S. Вероятно, в силу гомологии, 16S rRNA выравнивается на 18S rRNA, а 23S rRNA на 28S rRNA.