Практикум 5

Нуклеотидный BLAST

Задание 1

В выбранном мною организме, домашней кошке, необходимо было найти ген белка дельта-субъединицы АТФ-синтазы (ATP synthase subunit delta)

При помощи поиска в геномном браузере я узнал, что у кошки он имеет идентификатор ATP5F1D. Далее мной был получен FASTA-файл его аминокислотной последовательности

Также я узнал, что закодирован этот белок в хромосоме А2, идентификатор записи: 101085528, оба файла можно загрузить по ссылке ниже.


protein-FASTA-download

gene-FASTA-download

Задание 2

Кошка относится к вторичноротым животным, поэтому берем первичноротых пчелок(Apoidea).

Результаты работы BLAST:

megablast: найдено 0 последовательностей при любых параметрах. Можно предположить, что последовательность содержит множество нуклеотидных синонимичных замен, поэтому BLAST не может найти похожие нуклеотидные последовательности у Пчел.

tblastn: найдено 25 последовательностей.Совпадние в среднем 65-процентное, и учитвая то, что Пчелы от Кошачьих далеки, то подобный результат показывает высокую консервативность генов, кодирующих АТФ-синтазу(в данном случае дельта-субьединицу)

Параметры работы BLAST:

megablast: Параметры были взяты по умолчанию (E-value = 10, word_size = 11)

tblastn: Параметры были взяты по умолчанию (E-value = 0.05, word_size = 5

download tblastn results

Задание 3

Команда для индексации генома:

makeblastdb -in GCF_018350175.1_F.catus_Fca126_mat1.0_genomic.fna -dbtype nucl

Проводим поиск BLAST по 16S и 23S рРНК E.coli

Приведем описания этих РНК:

16S рРНК - формирует структуру рибосомы, учавствует в распознавании последовательности Шайна-Дальгарно и свойственна прокариотам, расположена в малой субьединице рибосомы

23S рРНК - расположена в большой субьединице бактериальной или архейной рибосомы, учавствует в инициации и элонгации трансляции, имеет каталитическую активность и помогает поддерживать структуру рибосомы,

используются в филогенетике в виду высококонсервативности

Я использовал программу blastn, поскольку анализирую неродственные организмы и имею на вход нуклеотидные последовательности, структуры не кодируют белки.

Код, который использовался для анализа:

blastn -task blastn -query 16SrRNA_ecoli.fa -db GCF_018350175.1_F.catus_Fca126_mat1.0_genomic.fna -out blastn_16S.out -evalue 0.01 -word_size 7 -outfmt 7

В случае 16S рРНК было получено 8 результатов, все они расположены в хромосоме 1. получается 4 гомолога по 2 хита, то есть у нас для одного гомолога получаются промежутки 887-998 и 1494-1536, и таких у нас 4 гомолога

blastn -task blastn -query 23SrRNA_ecoli.fa -db GCF_018350175.1_F.catus_Fca126_mat1.0_genomic.fna -out blastn_23S.out -evalue 0.01 -word_size 7 -outfmt 7

В случае 23S рРНК было получено 27 результатов, расположены в хромосоме Е1 и митохондриальном геноме. 9 гомологов, получаем такое значение по координатам находок, и видим те, которые сливаются

Скачать результаты можно по ссылке ниже

download 16SrRNA results

download 23SrRNA results