В выбранном мною организме, домашней кошке, необходимо было найти ген белка дельта-субъединицы АТФ-синтазы (ATP synthase subunit delta)
При помощи поиска в геномном браузере я узнал, что у кошки он имеет идентификатор ATP5F1D. Далее мной был получен FASTA-файл его аминокислотной последовательности
Также я узнал, что закодирован этот белок в хромосоме А2, идентификатор записи: 101085528, оба файла можно загрузить по ссылке ниже.
Кошка относится к вторичноротым животным, поэтому берем первичноротых пчелок(Apoidea).
Результаты работы BLAST:
megablast: найдено 0 последовательностей при любых параметрах. Можно предположить, что последовательность содержит множество нуклеотидных синонимичных замен, поэтому BLAST не может найти похожие нуклеотидные последовательности у Пчел.
tblastn: найдено 25 последовательностей.Совпадние в среднем 65-процентное, и учитвая то, что Пчелы от Кошачьих далеки, то подобный результат показывает высокую консервативность генов, кодирующих АТФ-синтазу(в данном случае дельта-субьединицу)
Параметры работы BLAST:
megablast: Параметры были взяты по умолчанию (E-value = 10, word_size = 11)
tblastn: Параметры были взяты по умолчанию (E-value = 0.05, word_size = 5
Команда для индексации генома:
makeblastdb -in GCF_018350175.1_F.catus_Fca126_mat1.0_genomic.fna -dbtype nucl
Проводим поиск BLAST по 16S и 23S рРНК E.coli
Приведем описания этих РНК:
16S рРНК - формирует структуру рибосомы, учавствует в распознавании последовательности Шайна-Дальгарно и свойственна прокариотам, расположена в малой субьединице рибосомы
23S рРНК - расположена в большой субьединице бактериальной или архейной рибосомы, учавствует в инициации и элонгации трансляции, имеет каталитическую активность и помогает поддерживать структуру рибосомы,
используются в филогенетике в виду высококонсервативности
Я использовал программу blastn, поскольку анализирую неродственные организмы и имею на вход нуклеотидные последовательности, структуры не кодируют белки.
Код, который использовался для анализа:
blastn -task blastn -query 16SrRNA_ecoli.fa -db GCF_018350175.1_F.catus_Fca126_mat1.0_genomic.fna -out blastn_16S.out -evalue 0.01 -word_size 7 -outfmt 7
В случае 16S рРНК было получено 8 результатов, все они расположены в хромосоме 1. получается 4 гомолога по 2 хита, то есть у нас для одного гомолога получаются промежутки 887-998 и 1494-1536, и таких у нас 4 гомолога
blastn -task blastn -query 23SrRNA_ecoli.fa -db GCF_018350175.1_F.catus_Fca126_mat1.0_genomic.fna -out blastn_23S.out -evalue 0.01 -word_size 7 -outfmt 7
В случае 23S рРНК было получено 27 результатов, расположены в хромосоме Е1 и митохондриальном геноме. 9 гомологов, получаем такое значение по координатам находок, и видим те, которые сливаются
Скачать результаты можно по ссылке ниже