Учебный сайт Птицыной Елены

Cтудентки первого курса факультета биоинженерии и биоинформатики Московского государственного университета имени М.В. Ломоносова

Семестр 3, практикум 10

Назад на учебную страницу Птицыной Елены

Геномные браузеры

В этом практикуме мы учились работать с геномными браузерами (UCSC genome browser, Ensembl, NCBI Genome Data Viewer).

Мутация G2019S в лейцин-богатой киназе 2 человека - распространённый фактор развития семейной болезни Паркинсона [1]. В практикуме 10 приводится информация об этой киназе, которую можно получить из геномных браузеров.

Задание 1. UCSC

В первом задании надо было использовать браузер UCSC (табл.1, 2).

Таблица 1. Характеристика, полученная со страницы LRRK2 (ENST00000298910.12) at chr12:40224997-40369285 - Homo sapiens leucine rich repeat kinase 2 (LRRK2), mRNA. (from RefSeq NM_198578) и со страниц, на которые можно перейти по ссылкам.
Gencode ID ENSG00000188906
Короткое имя гена LRRK2
Цепь Прямая
Плечо и полоса chr12 (q12)
Координаты в хромосоме 40,224,997-40,369,285
Число альтернативных продуктов (РНК) 2
Таблица 2. Характеристики транскриптов GENCODE
Gencode Transcript Координаты в хромосоме Длина аминокислотной последовательности Число экзонов (общее)
ENST00000298910.12 40,224,997-40,369,285 2527 а.о. 51
ENST00000343742.6 40,225,011-40,304,976 1271 а.о. 27
1gtrRNA
Рисунок 1. Треки: транскрипты GENCODE и RefSeq, консервативность последовательности среди позвоночных (Conservation), частые полиморфизмы (Common SNPs) последней версии (151).

Задание 2. Ensembl

Во втором задании надо было использовать Ensembl.

Было построено выравнивание гена LRRK2 человека с гомологичным геном шимпанзе. Использованные указания с kodomo: "Найдите заданный ген в поиске Ensembl. В меню слева выберите Comparative Genomics → Genomic alignments. Нажмите Select another alignment, введите название организма – Chimpanzee → Apply. Сохраните полученное выравнивание (Download)."

Информация о выравнивании, полученная командой infoalign -html -only -name -seqlength -gapcount -diffcount -heading -alignlength Human_Chimpanzee_lastz.fa -out ens.infoalign , приведена ниже (табл.3).

Таблица 3. Информация о выравнивании.
NameSequence LengthAligned LengthGap LengthDifference
homo_sapiens_1-173045 172542 173045 503 0
pan_troglodytes_1-173045 172105 173045 940 1927

Процент различий на 100 нуклеотидов = 1.1136% ~ 1.11% (1927/173045*100), что согласуется с литературными данными [2].

Источники:
1. https://omictools.com/4f4ca10b68bd5eb4ab2eebad6967b181-dataset
2. https://www.ncbi.nlm.nih.gov/pubmed/15716009