UCSC

Нашла выбранный в пункте 2 практикума 12 белок человека (DAD1_HUMAN) в UCSC браузере (рис. 1).

Рисунок 1. Находки по запросу DAD1_HUMAN.

Указываю: короткое (DAD1) и полное (Homo sapiens defender against cell death 1) имя гена, на какой цепи он закодирован (-), в какой хромосоме находится (14), к каким плечу и полосе принадлежит участок (chr14:q11.2), координаты гена в последовательности хромосомы (23033807-23058143), сколько альтернативных продуктов закодировано в гене (0), для каждого продукта укажите число экзонов и длину аминокислотной последовательности (для моего гена нашлись 3 экзона и длина белка 113 аминокислот).
Сохраните картинку окрестности гена из Genome Browser c треками: гены USCS и RefSeq (USCS Genes и RefSeq Genes), метилирование ДНК (ENC_DNA_Methylation), консервативность последовательности среди млекопитающих (Conservation), полиморфизмы (Common SNPs), и, случайно, схема альтернативного сплайсинга (рис. 2).

Рисунок 2. Окрестность гена DAD1_HUMAN в Genome Browser.


Ensembl

Нашла заданный ген (DAD1) в поиске Ensembl. В меню слева выбрала Comparative Genomics -> Genomic alignments, построила выравнивание выбранного гена человека с гомологичным геном шимпанзе (ссылка на полученный файл).
Программа distmat пакета EMBOSS вычисляет эволюционные "расстояния" для последовательностей во множественных выравниваниях, которые выражаются в числе замен на 100 нуклеотидов. Подсчитала число различий данной программой и получила: 1,52 на 100 нуклеотидов, т.е последовательности можно считать достаточно близкими. Выдача программы:

Distance Matrix
---------------
Uncorrected for Multiple Substitutions
Using base positions 123 in the codon
Gap weighting is 0.000000
	    1	    2
	  0.00	  1.52		homo_sapiens_1-24434 1
		  0.00		pan_troglodytes_1-24434 2

Узнала число полиморфизмов, выбрав в меню слева Genetic Variation -> Vatiation table: всего их 4419 (рисунок 3).

Рисунок 3. Полиморфизмы в гене DAD1_HUMAN.

Полученные данные можно интерпретировать следующим образом. Ради научного интереса мы построили выравнивание выбранного гена человека с гомологичным геном кошки, чтобы найти количество полиморфизмов на сто нуклеотидов и сравнить с аналогичными данными для шимпанзе.

Distance Matrix
---------------

Uncorrected for Multiple Substitutions
Using base positions 123 in the codon
Gap weighting is 0.000000

	    1	    2
	  0.00	 20.81		homo_sapiens_1-25212 1
		  0.00		felis_catus_1-25212 2

Видно, что полученный результат значительно больше, чем для шимпанзе. Это еще раз доказывает, что геномы человека и шимпанзе достаточно близки, особенно если сравнивать, например, с геномом млекопитающего из другого семейства - домашней кошки. Далее, зная количество полиморфизмов на сто нуклеотидов, мы можем определить число различий между геном DAD1 и гомологичным геном шимпанзе. Длина гена человека равна 24337, следовательно, число различий равно 24337 / 100 * 1.52 = 370. Это на порядок меньше, чем количество полиморфизмов для разных людей, по данным Ensemble (4419). Мы можем сделать вывод, что, во-первых, геномы человека и шимпанзе очень близки и, во-вторых, ген данного белка (DAD1_HUMAN, или ингибитор апоптоза) сильно подвержен полиморфизму.

 

 

© Дудина Дарья.