Для начала выберем белок, который мы будем использовать в этом задании
Мне было интересно обзорно изучить нечто, тем или иным образом связанное с
раком желудка
Короткое имя гена: CCKBR Полное имя гена: Cholecystokinin B receptor На какой цепи: + Хромосома: 11 Плечо и полоса хромосомы: chr11:p15.4 Координаты гена: 6270776 - 6271214 Альтернативных продуктов; транскриптов гена: 6 Транскрипты: 1) ENST00000334619.6 Total Exon Count: 5 447 aa chr11:6 259 736 - 6 272 127 2) ENST00000532715.5 Total Exon Count: 4 363 aa chr11:6 259 806 - 6 272 062 3) ENST00000525462.1 Total Exon Count: 4 516 aa chr11:6 259 926 - 6 272 127
Построим выравнивание гена нашего белка Human с таковым же у Шимпанзе
с помощью Ensembl. Далее, используя команду distmat получим
число несовпадений (на 100 нуклеотидов; выдача в виде матрицы):
1 2 0.00 1.33 homo_sapiens_1-12419 1 0.00 pan_troglodytes_1-12419 2
infoalign fname.fasta -only -alignlength -outfile outf.txt