Borovikova (grib.irina), report paige

Практикум 10. Геномные браузеры

Задание 1

Для выполнения данного практикума я решила взять человеческую метилтрансферазу (угадайте, чем навеяно) SHMT2.

Имя гена	SHMT2
Идентификатор Gencode	ENSG00000182199
Цепь	Прямая
Хромосома, координаты транскрипта	chr12:57,229,711-57,234,935
Плечо и полоса	q13.3
Число альтернативных транскриптов	5*

Таблица 1. Необходимая для Задания 1 информация

*Помимо 5 вариантов транскриптов самого SHMT2 на обратной цепи геномный браузер показал ген маркера чувствительности к лечению рака (AC137834.2) и три варианта митохонриального комплекса (NDUFA4L2).

Рассмотрим 3 произвольных транскрипта.

Транскрипт	ID Gencode	Координаты	Число экзонов	Длина последовательности белка
variant 1	ENST00000328923.8	chr12:57,229,711-57,234,935	12	504aa
variant 2	ENST00000557487.5	chr12:57,229,711-57,234,726	12	494aa
variant 3	ENST00000414700.7	chr12:57,230,086-57,234,726	11	483aa

Таблица 2. Информация о некоторых транскриптах.

Рисунок 1, 2. Локализация гена в хромосоме и окрестности гена из Genome browser, выравнивание с позвоночными, часто встречающиеся SNP.

Задание 2

С помощью геномного браузера Ensembl было получено выравнивание SHMT2 из H. sapiens и шимпанзе. Далее с помощью infoalign была получена информация, указанная в таблице 3 (сразу в форме html таблицы), в том числе - 'change'. Данная опция демонстрирует нам процент замен в последовательности, что и требовалось получить в задании. Можно сказать, что в среднем замена происходит через каждые 140 нуклеотидов.

Организм	Длина последовательности	%identity	%Change
homo_sapiens_1-5364	5363	5363	0.018643
pan_troglodytes_1-5364	5362	5326	0.708427

Таблица 3. Информация о последовательностях из выравнивания.

antropogenez.ru пишет, что геномы шимпанзе и человека отличаются всего на 1%, хотя у шимпанзе на одну пару хромосом больше. rationalwiki.org оценивает различия в 1,23%, хотя там представлено несколько вариантов сравнения: по однонуклеотидным заменам (результат упомянут ранее), замены и "процессы вставки и удаления", по числу идентичных белков, по "степени различия несинонимических пар оснований в белок-кодирующих районах". Все эти цифры сводятся к различию в 1-2%. Беглый осмотр остальных результатов гуглинга показал, что все оценки держатся в этом районе.

Задание 3

Первое, что бросается в глаза при открыти геномного браузера NCBI - тот факт, что для получения дополнительной информациии о транскриптах, о самом геноме не нужно открывать дополнительные вкладки. Здесь более ясная и удобная навигация по хромосомам - слева есть небольшая карта всех существующих, выше - рассматриваемой (но это есть и в других браузерах). Есть возможность выделить и рассмотреть отдельный экзом.

При поиске конкретного гена на выдачу в маленьком окошке браузер дает список совпадений (сразу с координатами), по которым можно без дополнительных подгрузок переместиться в нужную часть генома. Также эти совпадения отмечаются на уже упомянутой хромосомной идеограмме.

Наличие треков, как и в других браузерах, регулирутеся с помощью специального меню. По умолчанию демонстрируется покрытие выравниваний мРНК-экзонов, покрытие интронов, полученное из сплайсированных выравниваний мРНК, а также "intron features". Стоит сказать, что подсказки по трекам всплывают при наведении курсора (чего нет в Gencode и Ensembl). В списке треков присутствует "Epigenomics", где, насколько я поняла, в разных формах (heat map, например) можно рассмотреть последовательность из образца конкретной ткани, в том числе эмбриональной. А еще, насколько я поняла, здесь есть возможность создавать свои наборы треков.

В целом хочу сказать, что геномный браузер NCBI показался мне достаточно мобильным и интуитивным, хотя тот Gencode в целом способен с ним конкурировать. NCBI genome data viewer, по моим ощущениям, совмещает в себе многие плюсы Gencode и Ensembl, но я не уверена, что он способен полностью их заменить.

Рисунок 3. Пример работы в NCBI genome data viewer.