В данном практикуме я нашла ген, кодирующий дельта-субъединицу АТФ-синтазы рыси (этот организм был взят из предыдущего практикума), а также с помощью blast нашла его гомологи у пауков. Также с помощью blast я нашла в геноме рыси гены рРНК по их далеким гомологам из E. coli.
В файле GCF_007474595.2_mLynCan4.pri.v2_protein.faa (последовательности белков рыси) я искала аминокислотную последовательность нужной субъединицы. Поиск по кодовым словам subunit delta, delta, ATP synthase не нашел субъединицу дельта, поэтому я взяла subunit d, как наиболее похожую на искомое. Файл с последовательность : XP_030152356.1.txt
Идентификатор гена я искала в файле с аннотацией GCF_007474595.2_mLynCan4.pri.v2_genomic.gbff по XP_... Я определила ген, кодирующий эту субъединицу (искала Locus, двигаясь вверх от найденной последовательности) - нашла NC_044316, gene ATP5PD. А затем в NCBI nucleotides нашла последовательность ДНК гена и скачала ее : NC_044316.2.fa
Далее я решила провериь консервативность АТФ-синтазы, а в частности ее d-субъединицы, у удаленных таксонов (Кошачьи и Пауки). Для этого были применены разные программы BLAST.
Программа blastn - выполнила сравнение генов (нуклеотидных последовательностей) субъединицы у разных организмов. В результате мы получили 244 находки (файл) Но, как видно из характеристик находок, покрытие очень мало (0-1%) и участки выравнивания тоже очень короткие (не более 80 нуклеотидов)ю Таким образом, нам кажется, что субъединицы АТФ рыси и пауков сильно отличаются. Правда, мы должны отметить, что blastn не учитывается вырожденность генетического кода. Поэтому проверим на программе tblastn, сравнивающей белковые последовательности. Результаты
Результаты tblastn оказались более значимыми - да, мы получили всего две находки, но зато с покрытием 25-40%. Получается, что если сравнивать по последовательнстям аминокислот, то субъединицы высококонсервативны. Результаты
*Поиск в blast осуществлялся по базам данных refseq_genomes, все остальные параметры поиска стояли по умолчанию.
Для индексации генома я установила BLAST+ на мой компьютер - из файла ncbi-blast-2.16.0+-win64.exe.
У меня есть геном рыси и рРНК E. coli - 16S рРНК, 23S рРНК
Индексация генома была произведена с помощью команды :
makeblastdb -in GCF_007474595.2_mLynCan4.pri.v2_genomic.fna -dbtype nucl
Далее я искала гомологи 16S и 23S рРНК у отдаленных огранизмов (рыси и E. coli) по нуклеотидной последовательности, для этой задачи использовала blastn :
blastn -task blastn -query 16S.txt -db GCF_007474595.2_mLynCan4.pri.v2_genomic.fna -out blastn_16S.out -evalue 0.05 -outfmt 7
blastn -task blastn -query 23S.txt -db GCF_007474595.2_mLynCan4.pri.v2_genomic.fna -out blastn_23S.out -evalue 0.05 -outfmt 7
В результате получила файлы blastn_23S.out и blastn_16S.out.
У 23S РНК оказалось 4 находки, одна на хромосоме E1 (NC_044316.2), три на хромосоме D3 (NC_044314.2). Участок хромосомы Е1 - искомый гомолог, на хромосоме D3 по координатам получается один гомолог.
У 16S РНК - 1 находка на хромосоме E1 и, соответсвенно, один гомолог. Выравнивания гомологичных участков можно посмотреть в файлах blastn_23S_text.out
и blastn_16S_text.out. Данные файлы (а также названия хромосом) были получены командами :
blastn -task blastn -query 16S.txt -db GCF_007474595.2_mLynCan4.pri.v2_genomic.fna -out blastn_16S_text.out -evalue 0.05
blastn -task blastn -query 23S.txt -db GCF_007474595.2_mLynCan4.pri.v2_genomic.fna -out blastn_23S_text.out -evalue 0.05
рРНК нужны для синтеза белка и поддержания структуры рибосом. 16S рРНК обеспечивает связывание малой субъединицы рибосомы с мРНК во время трансляции, а 23S рРНК нужна для роста пептидной цепи.