UCSC
Нашла выбранный в пункте 2 практикума 12 белок человека (DAD1_HUMAN) в UCSC браузере (рис. 1).
Рисунок 1. Находки по запросу DAD1_HUMAN.
Указываю:
короткое (DAD1) и полное (Homo sapiens defender against cell death 1) имя гена,
на какой цепи он закодирован (-),
в какой хромосоме находится (14),
к каким плечу и полосе принадлежит участок (chr14:q11.2),
координаты гена в последовательности хромосомы (23033807-23058143),
сколько альтернативных продуктов закодировано в гене (0),
для каждого продукта укажите число экзонов и длину аминокислотной последовательности (для моего гена нашлись 3 экзона и длина белка 113 аминокислот).
Сохраните картинку окрестности гена из Genome Browser c треками:
гены USCS и RefSeq (USCS Genes и RefSeq Genes),
метилирование ДНК (ENC_DNA_Methylation),
консервативность последовательности среди млекопитающих (Conservation),
полиморфизмы (Common SNPs), и, случайно, схема альтернативного сплайсинга (рис. 2).
Рисунок 2. Окрестность гена DAD1_HUMAN в Genome Browser.
Ensembl
Нашла заданный ген (DAD1) в поиске Ensembl. В меню слева выбрала Comparative Genomics -> Genomic alignments, построила выравнивание выбранного гена человека с гомологичным геном шимпанзе (ссылка на полученный файл).
Программа distmat пакета EMBOSS вычисляет эволюционные "расстояния" для последовательностей во множественных выравниваниях, которые выражаются в числе замен на 100 нуклеотидов.
Подсчитала число различий данной программой и получила: 1,52 на 100 нуклеотидов, т.е последовательности можно считать достаточно близкими.
Выдача программы:
Distance Matrix --------------- Uncorrected for Multiple Substitutions Using base positions 123 in the codon Gap weighting is 0.000000 1 2 0.00 1.52 homo_sapiens_1-24434 1 0.00 pan_troglodytes_1-24434 2
Узнала число полиморфизмов, выбрав в меню слева Genetic Variation -> Vatiation table: всего их 4419 (рисунок 3).
Рисунок 3. Полиморфизмы в гене DAD1_HUMAN.
Полученные данные можно интерпретировать следующим образом. Ради научного интереса мы построили выравнивание выбранного гена человека с гомологичным геном кошки, чтобы найти количество полиморфизмов на сто нуклеотидов и сравнить с аналогичными данными для шимпанзе.
Distance Matrix --------------- Uncorrected for Multiple Substitutions Using base positions 123 in the codon Gap weighting is 0.000000 1 2 0.00 20.81 homo_sapiens_1-25212 1 0.00 felis_catus_1-25212 2
Видно, что полученный результат значительно больше, чем для шимпанзе. Это еще раз доказывает, что геномы человека и шимпанзе достаточно близки, особенно если сравнивать, например, с геномом млекопитающего из другого семейства - домашней кошки. Далее, зная количество полиморфизмов на сто нуклеотидов, мы можем определить число различий между геном DAD1 и гомологичным геном шимпанзе. Длина гена человека равна 24337, следовательно, число различий равно 24337 / 100 * 1.52 = 370. Это на порядок меньше, чем количество полиморфизмов для разных людей, по данным Ensemble (4419). Мы можем сделать вывод, что, во-первых, геномы человека и шимпанзе очень близки и, во-вторых, ген данного белка (DAD1_HUMAN, или ингибитор апоптоза) сильно подвержен полиморфизму.