Для этого задания был выбран белок Mlh1 комплекса MutL мисматч-репарации человека, который отвечает за белок-белковые взаимодействия во время репарации. В результате была получена информация, представленная в таблице 1.
Короткое имя гена | MLH1 |
Genecode ID гена | ENSG00000076242.14 |
Цепь | Прямая |
Номер хромосомы | 3 |
Плечо и полоса | chr3:p22.2 |
Альтернативные продукты (РНК), GENCODE | 6 |
Затем были взяты 3 альтернативных транскрипта и для них была собрана информация из аннотации GENCODE в таблице 2.
Идентификатор GENCODE | Координаты в хромосоме | Число экзонов | Длина белка (а.о.) | |
Transcript variant 23 | ENST00000231790.6 | 36,993,332-37,050,918 | 19 | 756 |
Transcript variant 19 | ENST00000536378.5 | 36,993,350-37,050,842 | 18 | 515 |
Transcript variant 7 | ENST00000458205.6 | 36,993,776-37,050,846 | 20 | 515 |
Затем была получена картинка с треками GENCODE, RefSeq, Conservation и Common SNPs (151).
С помощью базы ENSEMBL было получено выравнивание белка Mlh1 шимпанзе и человека. С помощью команды "infoalign pr10.fasta -only -name -heading -change -seqlength -diffcount -alignlength -html pr10_1.txt" была получена html таблица 3 с данными о выравнивании.
Name | Sequence Length | Aligned length | Difference | % Change |
homo_sapiens_1-57730 | 57587 | 57730 | 0 | 0.247705 |
pan_troglodytes_1-57730 | 57456 | 57730 | 496 | 1.333795 |
Процент различий на 100 нуклеотидов можно подсчитать: 496/57730*100=0.8592%. Полногеномная оценка говорит о различии между геномами до 4%, что сходится с полученной оценкой.
Назад