Практикум 10

Поиск в нуклеотидных банках по аннотации. Выравнивание геномов

Автор старался, но не может гарантировать отсутствие биологических ошибок.

Для выполнения практикума был выбран митохондриальный геном (митохондрион) ирбиса - Panthera uncia (также известен как ирбис или снежный леопард). Ирбис относится к общему роду со львами, которым были посвящены прошлые практикумы. Посмотреть на единственную Panthera, проживающую в холодном климате можно на рисунке 1. Снежные барсы встречаются на территории моей родной Республики Тыва, и сравнительно недавно (зима 2021-2022) в горах на фотоловушку попал ирбис (все представленные фото хищника получены с этой "съёмки", почитать можно здесь). Сравнивать весь геном эукариота с геномом другого организма тяжело как минимум из-за длины последовательности. Поиск подходящей последовательности генома P. uncia проводился в "сборном" банке "Nucleotides" на NCBI по базе данных RefSeq. Результат поиска показал, что для ирбиса есть полный митохондрион (NC_010638), подходящий по длине для проведения сравнительного выравнивания двух последовательностей в blast.

The snow leopard
Рисунок 1. Очаровательный Хоргай - представитель Panthera uncia. Источник: WWF.
The zebra fish
Рисунок 2. Интереснейшая Danio rerio. Источник: a-z-animals.com.

Изначально планировалось сравнение митохондрионов ирбиса и льва. Но результаты показали, что они практически не отличаются и описывать карту локального сходства будет не так интересно. Поэтому в итоге второй последовательностью был выбран митохондрион модельного организма Danio rerio (рисунок 2). Нужен был не слишком родственный, но и не дальний организм (для Caenorhabditis elegans сходство митохондрионов megablastом уже не обнаруживалось).
Program version: BLASTN 2.14.1+.
Результаты выравнивания blastn и megablast представлены соответственно на рисунках 3 и 4. Параметры работы программ были оставлены по умолчанию. Видно, что гомология последовательностей прослеживается по результатам blastn, результаты megablast же говорят о высокой консервативности только небольшого участка. Построенные карты локального сходства не показали глобальных перестроек генома. "Пропуски" говорят лишь о наличии малосходных участков.

blast dotplot
Рисунок 3. Карта локального сходства, построенная BLASTN, для P. uncia (горизонтальная ось) и D. rerio (вертикальная ось).
megablast dotplot
Рисунок 4. Карта локального сходства, построенная Megablast, для P. uncia (горизонтальная ось) и D. rerio (вертикальная ось).

Единственную потенциальную перестройку можно заметить присматриваясь к последним нуклеотидам. Геномы изучаемых организмов слегка отличаются по длине и это заметно в левом верхнем конце - возможно у P. uncia произошла вставка в митохонрион, а возможно, наоборот, у D.reiro - делеция (200 нуклеотидов переносить в ядерный геном мне кажется нецелесообразным, но и такое, вероятно, могло быть).
При уменьшении длины слова в blastn до 7 особых изменений в картине не выявляется, но если при этом сменить значение Match/Mismatch Scores на 1/-1 (влияние совпадений и несовпадений на общий score выравнивания), то длина гомологичных участков растет, а при изменении штрафов за гэпы (на Existence: 2 Extension: 1) линия графика и вовсе становится сплошной (рисунок 5). При этом можно в правом нижнем углу заметить небольшой "штрих", что возможно говорит о том, что запись гена в базу данных начиналась в двух организмах с разных мест.

blastn modified dotplot
Рисунок 5. Карта локального сходства, построенная BLASTN, для P. uncia (горизонтальная ось) и D. rerio (вертикальная ось) при Word size = 7, Match/Mismatch Scores = 1,-1, Gap Costs = Existence: 2 Extension: 1.
funny snow leopard
Рисунок 6. P. uncia для хорошего настроения. Источник: WWF.
fun snow leopard
Рисунок 7. Понравилось ирбису делать селфи). Источник: WWF.