Практикум 8

Поиск в геноме эукариота гена, кодирующего δ-субъединицу АТФ-синтазы

В геноме эукариота Hippocampus zosterae (Морской конек) было найден ген atp5f1d, ему соотвествуют 2 изоформы XP_051928876.1 и XP_051928877.1

Рисунок 1. Окрестность участка из геномного браузера Gene ID 127605417, кодирующего ATP synthase subunit delta, mitochondrial (NC_067458.1). Координаты 16759684-16769130

Файл с полной последовательностью гена atp5f1d, включая интроны

Файл с последовательностью белка XP_051928876.1

Файл с последовательностью транскрипта

Различные варианты BLAST для фрагмента ДНК

Мой организм Hippocampus zosterae (Морской конек) является вторичноротым, поэтому поиск производился по таксону Araneae (Пауки).

База данных для поиска - refseq_genomes.

На вход в blastn подавалась нуклеотидная последовательность гена

На вход tblastn подавалась последовательность белка XP_051928876.1

Рисунок 2. Графический результат поиска blastn 37 находок. Blastn Не дает биологически значимой информации
Рисунок 3. Графический результат поиска с tblastn. Получено 4 гомолога и 8 находок. Поиск с помощью tblastn среди эволюционно далеких организмов является более информативным, так как аминокислотная последовательность более консервативна, чем нуклеотидная.

blastn

В Blastn выравнивания прерывистые и менее значимые, т.к в изначальной последовательности присутсвуют интроны. В tblastn уже происходит выравнивание только экзонов в правильной рамке считывания, выравнивание получается более цельным, к тому же белковые последовательности более консервативные.

Поиск с помощью tblastx не удалось провести

Поиск в геноме эукариота генов основных рибосомальных РНК по далекому гомологу

makeblastdb -in GCF_025434085.1_ASM2543408v3_genomic.fna -dbtype nucl -title "Genome_Database" -out db

Команда для поиска blastn для 16S РНК Escherichia coli

blastn -task blastn -query rRNA_ecoli_16S.fasta -db db -word_size 7 -evalue 0.001 -out 16s_Esh.out -outfmt 7

Команда для поиска blastn для 23S РНК Escherichia coli

blastn -task blastn -query rRNA_ecoli_23S.fasta -db db -word_size 7 -evalue 0.001 -out 23s_Esh.out -outfmt 7

Поиск Blast для 16S RNA

Поиск Blast для 23S RNA

При поиске гомологов 16S pРНК выдало 316 находок. Среди них по одному гомологу на NC_067458.1 и NC_067464.1, содержащих участки 1494-1536, два гомолога на NC_067459.1. 19 гомологов на скэффолде NC_067457.1 (участки 887-998, 1494-1536). Большое количево гомологов на остальных скэффолдах. На рисунке 4 проилюстрировано 2 гомолога на скэффолде NC_067459.1.

Рисунок 4. Примеры гомологов 16S pРНК

Карты локального сходства

Для выравнивания использовались megablast и blastn. Выбраны 2 вида из рода Metallosphaera (род архей): Metallosphaera cuprina Ar-4, Metallosphaera sedula DSM 5348.

Рисунок 5. Карта локального сходсва хромосом Metallosphaera cuprina Ar-4 и Metallosphaera sedula DSM 5348 построенная с помощью megablast. Программа выравнивает только очень схожие последовательности.
Рисунок 6. Карта локального сходсва хромосом Metallosphaera cuprina Ar-4 и Metallosphaera sedula DSM 5348 построенная с помощью blastn.

На картах локального сходства обоих поисков видно начало и конец прямого выравнивания (1-50 К, 1800 К)и далее крупные участки инверсии на протяжении почти всей карты. Кроме того, megablast, выравнивая только очень схожие последовательности, почти не видит участков траслокации, предсатвленных на карте сходств поиска blastn (200, 650, 1150, 1300-1400 К).

blastn

megablast