🌸Назад

δ-субъединица АТФ-синтазы

C использованием файла скачанного в прошлом практикуме *protein.faa. Найден ген, кодирующий данный белок его код XP_038423949.1.

В файле формата GBFF по поиску Locus ищем последений локус до нашего протеина - NC_049241.1, находящийся на 20 хромосоме.

1
Рисунок 1.Белок XP_038423949.1 на 20 хромосоме Canis lupus familiaris. Ген, кодирующий δ-субъединицу АТФ-синтазы NC_049241.1. Красным цветом обознаечны CSD имеющие координаты 58,028,851 - 58,030,467

Разные варианты BLAST для фрагмента ДНК

Я провела сравнение фрагмента последовательности белок-кодирующей области δ-субъединицы АТФ-синтазы собаки(Canis lupus familiaris) с таксоном пчел(Apoidea). Семейства собачьи и пчелиные достаточно сильно удалены друг от друга, поэтому выдача должна быть интересной. В качестве базы данных в обоих бластах был использован refseq_genomes, по итогу нашлось 38 сборок.

Первый используемый метод - blastn для NC_049241.1 с координатами 58027996-58031287 и Apoidea, на мой взгляд он больше подходит чем megablast для поставленной задаче, потому что рассматриваемые последовательности не являются высокогомологичными.Blastn cравнивает нуклеотидную последовательность с нуклеотидной базой данных.

1
Рисунок 2.Параметры blastn.
1
Рисунок 3.Графическая выдача blastn. Всего найдено 8 находок длинной меньше 100 нуклеотидов. Параметр длины слова я использовала 11.

Второй используемый метод - tblastn для белка атф-синтазы и Apoidea, он сравнивает белковую последовательность (запрос) с нуклеотидной базой данных.

1
Рисунок 4.Параметры tblastn.
1
Рисунок 5.Графическая выдача tblastn. Всего найдено 38 находок длиной от 80 до 200 нуклеотидов. Параметр длины слова я использовала 5.

Для tblastn больше находок, чем для blastn, потому что он ищет менее консервативные варианты гомологов.

Разные варианты BLAST для фрагмента ДНК

1
Рисунок 6.Анализ выдачи для 16s РНК(1 в моих заданиях). Две находки соответсвуют одному одному гомологу в геноме NW_023331571.1

Найдена аннтоация для NW_023331571.1

Построение карт локального сходства

Для выполнения этого задания мной были выбраны 2 родственных организма Chromobacterium phragmitis и Chromobacterium violaceum. Для построения карт локального сходства были использованы их хромосомные ID GenBank CP029495.1 и соответственно CP069587.1

1
Рисунок 7.Графическая выдача megablast.
1
Рисунок 8.Графическая выдача blastn.

На обеих картах видно транслокацию, делецию и инверсию, хотя основная часть выровнялась. Общий вывод который можно сделать - карты локального сходства отличаются, на второй картинке видно, что между последовательностями есть точечные различия единичные нуклеотидные замены (SNP)(их очень много в отличии от первой) или очень короткие инделы (вставки/делеции), основная часть картинки совпадает, что указывает на близкое родство двух организмов.