Практикум 10.

Геномные браузеры

UCSC

Для выполнения этого задания я выбрала белок Casp3 (каспаза-3)
Таблица 1. Результаты поиска
Имя гена CASP3
Gencode ID ENSG00000164305.19
Цепь Обратная
Хромосома chr4:q35.1
Количество альтернативных продуктов (транскриптов) закодировано в гене 5
Таблица 2. Характеристики альтернативных транскриптов
Транскрипт transcript variant 1 transcript variant 9 transcript variant 2
Gencode ID ENST00000308394.9 ENST00000393585.6 ENST00000523916.5
координаты в хромосоме (включая UTR'ы) 184627696-184649447 184627696-184648592 184627696-184649509
число экзонов (общее) 8 7 7
длина последовательности белка, а.о. 277 182 277
Рис.1 . изображение окрестности гена Casp3
picture

Ensembl

С помощью Ensembl я нашла свой выбранный белок человека Casp3 и построила его выравнивание с гомологом из шимпанзе. Затем командой infoalign из EMBOSS: infoalign Human_Chimpanzee_lastz.fasta -html -only -name -heading -alignlength -diffcount ali_table.txt я получила таблицу 3 с характеристиками выравнивания, на основании которых можно посчитать процент различий на 100 нуклеотидов. В итоге, процент различий составил 1,25%. В интернетах я нашла данные, что различия генов человека и шимпанзе составляют примерно 4% (полногеномная оценка, версия для отбитых), так что полученное мной не противоречит этому.
Выравнивание здесь.
Таблица 3. Характеристики выравниваний
NameAligned LengthDifference
homo_sapiens_1-21902 21902 0
pan_troglodytes_1-21902 21902 273