Задание 1

В файле с последовательностями блеков я нашла белок, аннотированный как δ-субъединица АТФ-синтазы

Поиск производился в файле с помощью запроса ATP synthase. По итогу последовательность была сохранена в формате fasta

Идентификатор белка >NP_495286.1 и его последовательность

Поиск идентификатор нуклеотидной записи проводился с помощью поиска по запросу LOCUS (регистр имеет значение)

Идентифткатор нуклеотидной записи: NC_003280.10

Ссылкa на файл с последовательностью небольшой окрестности этого гена в FASTA-формате

Задаание 2

Целью этого задания было провести поиск гена δ-субъединицы АТФ-синтазы в геномах из выбранного таксона (в моем случае, собачьи — Canidae) с использованием методов BLAST. В поиске использовались две разные методики BLAST: blastn и tblastn, с целью изучить, как разные подходы могут влиять на результаты поиска.

Так как мой исходный организм - c.elegans - является первичноротым, то я решила выбрать Собачьи (Canidae).Для поиска использовалась база данных refseq_genomes, которая включает высококачественные геномы различных организмов. В рамках выбранного таксона Canidae в базе данных находятся 7 сборок.

Полагаю, что δ-субъединица АТФ-синтазы может показывать низкую консервативность в некодирующих регионах или участках ДНК, я ожидала:

blastn: относительно небольшое число совпадений, так как метод требует точных совпадений ДНК-последовательностей. tblastn: большее число совпадений, так как метод работает с белковыми последовательностями и учитывает вариации в кодировании аминокислот

blastn: я не меняла базовые настройки при поиске. Результаты показали два совпадения с последовательностями ДНК в геномах собак.

Выдача

Значение e-value 0.013 указывает, что вероятность случайного совпадения относительно велика. Это значение выше стандартного (обычно 0.001), поэтому совпадение может быть биологически незначимым

Я использовала tblastn чтобы найти гомологов белка. Тут результат дал нам 8 находок

Выдача

Тут же e-value гораздо ниже, что говорит о практически нулевой вероятности того, что совпадение между данной последовательностью и последовательностью из базы данных произошло случайно

Оба метода обнаружили последовательности из геномов Vulpes lagopus (песец) и Vulpes vulpes (лиса обыкновенная). Находок в 1 случае меньше ,возможно это связано с низкой степенью консервативности данного участка ДНК между родственными видами или с меньшим количеством подходящих последовательностей в базе данных

Задание 3

Я проиндексировала последовательност генома с помощью команды

 makeblastdb -in GCF_000002985.6_WBcel235_genomic.fna  -dbtype nucl

Далее я провела поиск 16S рРНК и 23S рРНК в полученной базе данных

Функции 16S рРНК: участвует в связывании мРНК с рибосомой через взаимодействие с Shine-Dalgarno последовательностью мРНК, помогая инициировать трансляцию.

Формирует каркас малой субъединицы рибосомы, поддерживая её пространственную организацию

Функции 23S рРНК: Участвует во взаимодействии с факторами, регулирующими разные этапы трансляции (инициация, элонгация, терминация)

23S рРНК выполняет катализ пептидилтрансферазной реакции – образования пептидной связи между аминокислотами.

Далее для поиска был использован алгоритм blastn, так как он оптимально подходит для анализа нуклеотидных последовательностей особенно если они принадлежат неродственным организмам

Команды:

blastn -task blastn -query 16S.fasta -db GCF_000002985.6_WBcel235_genomic.fna -out blastn_16S_text -evalue 0.05

blastn -task blastn -query 23S.fasta -db GCF_000002985.6_WBcel235_genomic.fna -out blastn_23S_text -evalue 0.05

ДЛя 16S выдача составила 4 находки, 4 гомолога

Для 23S выдача составила 7 находок, 2 гомолога

Выдача 16S

Выдача 23S