На главную

Задание 1

Для выполнения задания был выбран ген белка Aurora kinase b, принимающий важное участие в правильном прикреплении микротрубочек к центромере во время разделения хромосом. Координаты гена для этого белка взяты отдельно для каждого варианта, так как разные варианты имеют немного разные координаты

Короткое имя гена AURKB
Полное имя гена Aurora kinase B
Цепь -
Хромосома 17
Точная локализация на хромосоме chr17:p13.1
Количество альтернативных продуктов в gencode 4
номер gencode transcript альтернативного продукта координаты в последовательности хромосомы число экзонов длина аминокислотной последовательности
ENST00000578549.5 8,204,871-8,210,224 8 312
ENST00000585124.5 8,204,773-8,210,598 9 (кодирующих - 8) 344
ENST00000534871.5 8,204,743-8,210,581 8 (7 кодирующих) 303
ENST00000316199.10 8,204,733-8,210,582 9 (кодирующих 8) 345

На картинке видно, что наибольшая консервативность среди ста позвоночных наблюдается в местах локализации крупных экзонов, что логично, так как они отвечают за информацию транслируемую в последовательность белка. Интроны тоже консервативны в некоторых позициях что связано с необходимостью правильно позиционировать сплайсосому для точного сплайсинга. SNP помечены цветами согласно их локализации и эффекту, который они оказывают на транскрипт. Красным отмечен missense вариант (вставка другой аминокислоты), зеленым синонимичная замена, черным - замены, произошедшие в интронах и синим - в некодирующих регионах (в данном случае в 5' некодирующей области)

Задание 2

Было построено выравнивание и загружено в формате fasta. Далее при помощи программы пакета emboss distmat была получена информация о количестве замен на 100 пар нуклеотидов между последовательностями генов человека и шимпанзе.

Выравнивание в формате fasta Результат
aurb_align.fasta aurb_align.distmat

При поиске полиморфизмов, так как в задании требовалось рассмотреть наиболее часто встречающиеся полиморфизмы, был установлен порог на частоту встречаемости данного полиморфизма в популяции - не менее 0,001. Далее было посчитано число оставшихся однонуклеотидных полиморфизмов - 43 (исключены инсерции и делеции). Полученное число было поделено на длину последовательности гена человека, найденную из выравнивания при помощи infoalign (5868) и умножено на 100, чтобы найти число замен на 100 пар оснований. Для полиморфизмов внутри человеческой популяции получилось 0,733 замен на 100 пар нуклеотидов, а distmat выдал значение в 1.10 замен на 100 нуклеотидов. Получается, что последовательности человека и шимпанзе имеют немногим больше замен на 100 нуклеотидов, чем подобная частота замен внутри человеческой популяции, что говорит об эволюционной близости этих видов (однако имеющаяся разница в числе замен на 100 нуклеотидов хорошо заметна и достаточна для того чтобы эти два вида различать). Таким образом, внутри человеческой популяции два случайных аллеля скорее всего будут различаться меньше чем последовательности генов шимпанзе и человека.


© Кристина Перевощикова, 2017