На главную |
Задание 1
Для выполнения задания был выбран ген белка Aurora kinase b, принимающий важное участие в правильном прикреплении микротрубочек к центромере во время разделения хромосом. Координаты гена для этого белка взяты отдельно для каждого варианта, так как разные варианты имеют немного разные координаты
Короткое имя гена | AURKB |
Полное имя гена | Aurora kinase B |
Цепь | - |
Хромосома | 17 |
Точная локализация на хромосоме | chr17:p13.1 |
Количество альтернативных продуктов в gencode | 4 |
номер gencode transcript альтернативного продукта | координаты в последовательности хромосомы | число экзонов | длина аминокислотной последовательности |
ENST00000578549.5 | 8,204,871-8,210,224 | 8 | 312 |
ENST00000585124.5 | 8,204,773-8,210,598 | 9 (кодирующих - 8) | 344 |
ENST00000534871.5 | 8,204,743-8,210,581 | 8 (7 кодирующих) | 303 |
ENST00000316199.10 | 8,204,733-8,210,582 | 9 (кодирующих 8) | 345 |
На картинке видно, что наибольшая консервативность среди ста позвоночных наблюдается в местах локализации крупных экзонов, что логично, так как они отвечают за информацию транслируемую в последовательность белка. Интроны тоже консервативны в некоторых позициях что связано с необходимостью правильно позиционировать сплайсосому для точного сплайсинга. SNP помечены цветами согласно их локализации и эффекту, который они оказывают на транскрипт. Красным отмечен missense вариант (вставка другой аминокислоты), зеленым синонимичная замена, черным - замены, произошедшие в интронах и синим - в некодирующих регионах (в данном случае в 5' некодирующей области)
Задание 2
Было построено выравнивание и загружено в формате fasta. Далее при помощи программы пакета emboss distmat была получена информация о количестве замен на 100 пар нуклеотидов между последовательностями генов человека и шимпанзе.
|
|
|
|
При поиске полиморфизмов, так как в задании требовалось рассмотреть наиболее часто встречающиеся полиморфизмы, был установлен порог на частоту встречаемости данного полиморфизма в популяции - не менее 0,001. Далее было посчитано число оставшихся однонуклеотидных полиморфизмов - 43 (исключены инсерции и делеции). Полученное число было поделено на длину последовательности гена человека, найденную из выравнивания при помощи infoalign (5868) и умножено на 100, чтобы найти число замен на 100 пар оснований. Для полиморфизмов внутри человеческой популяции получилось 0,733 замен на 100 пар нуклеотидов, а distmat выдал значение в 1.10 замен на 100 нуклеотидов. Получается, что последовательности человека и шимпанзе имеют немногим больше замен на 100 нуклеотидов, чем подобная частота замен внутри человеческой популяции, что говорит об эволюционной близости этих видов (однако имеющаяся разница в числе замен на 100 нуклеотидов хорошо заметна и достаточна для того чтобы эти два вида различать). Таким образом, внутри человеческой популяции два случайных аллеля скорее всего будут различаться меньше чем последовательности генов шимпанзе и человека.
© Кристина Перевощикова, 2017