UCSC
Для выполнения задания был взят человеческий белок эластин (ELN); этот белок является частью эластичных волокн, входящих в состав экстрацеллюлярного матрикса и придающих эластичность органам и тканям организма (сердце, кожа, легкие, сосуды и др.);
○ Полное название: Homo sapiens elastin
○ Короткое название: ELN
○ Цепь: прямая (+)
○ Хромосома: №7
○ Плечо и полоса: chr7:q11.23
○ Положение на хромосоме:
- Транскрипт: chr7:74,027,789-74,069,907
- Кодирующий регион: chr7:74,028,188-74,068,700
○ 15 альтернативных продуктов (ссылка);
- Первый вариант: 33 экзона; длина белка: 724 аминокислоты;
- Второй вариант: 34 экзона; длина белка: 786 аминокислот;
- Третий вариант: 32 экзона; длина белка: 706 аминокислот;
Полное изображениеEnsembl
- Для построения выравнивания в Ensembl был взят ген ITIH3 ENSG00000162267, кодирующий третью цепь интер-альфа-трипсин ингибитора, который сравнивался с гомологичным белком шимпанзе;
○ Выравнивание в формате fasta
○ Для оценки различий между последовательностями в выравнивании использовалась команда distmat пакета Emboss;
○ Результат:
Distance Matrix --------------- Uncorrected for Multiple Substitutions Using base positions 123 in the codon Gap weighting is 0.000000 1 2 0.00 0.91 homo_sapiens_1-14277 1 0.00 pan_troglodytes_1-14277 2
○ Показатель 0.91 означает, что на 100 оснований в выравнивании последовательностей приходится в среднем 0.91 замен нуклеотидов;
○ Длина выравневания: 14277, соответственно всего присутствует:
(14277·0.91)/100 ≈ 130 нуклеотидных замен;
- Кроме того, для белка была составлена таблица полиморфизмов (экспортированная таблица Excel);
○ В таблице отражены лишь нуклеотидные замены и не учитываются вставки и делеции; это необходимо для более правдивого сравнения, поскольку команта distmat, исходя из ее описания, рассматривает лишь нуклеотидиные замены;
○ Из числа строчек в таблице видно, что обнаружено 12680 вариантов полиморфизмов;
©Машковская Анна, 2018