Геномные браузеры: UCSC genome browser, Ensemble, NCBI Genome Data Viewer
1. UCSC
Выбранный белок - 4 субъединица TRiC/CCT - АТФ-зависимого шаперона, участвующего в фолдинге 10% белков клетки[1] и необходимого для успешного фолдинга актина. Он состоит их двух, симметрично расположенных, колец по 8 субъединиц. [2] Этот белок может проводить фолдинг самостоятельно, но in vivo он взаимодеймтвует с другими шаперонами, вроде Hsp70 и префолдина. Именно апексом CCT4 он связывается с префолдином, который вращается вокруг поверхности электростатического взаимодействия, образованной отрицательно заряженными аминокислоныйми остатками CCT4 и положительно заряженными аминокслотными остатками 4-й и 6-й субъединиц префолдина. Замена аминокислотных остатков CCT4 на глутаминовую кислоту приводит к потери способности связываться с PFD и, как следствие, нарушению протеостаза клетки. [3] Информацию о гене CCT4 можно найти в Таблице 1. На Рис. 2 можно увидеть варианты транскриптов и их геномное окружение, в Таблице 2 - описание первых трёх транскриптов. Информация и изображение были взяты из UCSC genome browser.
Имя гена | CCT4 |
Gencode ID | ENSG00000115484.15 |
Цепь | - |
Хромосома и плечо | Chr2:p15 (Короткое плечо 2-й хромосомы, полоса 15) |
Количество альтернативных продуктов | 4 |
Рис. 1. Взамодействие TRiC и PFD через CCT4.(Источник)
Рис. 2. Геномное окружение гена CCT4 из UCSC genome browser
Транскрипт (Gencode ID) | ENST00000394440.8 | ENST00000544079.2 | ENST00000425779.1 |
Позиция в хромосоме | 61,868,085-61,888,656 | 61,868,125-61,888,671 | 61,868,432-61,886,082 |
Количество экзонов | 14 | 13 | 2 |
Длина последовательности белка | 539 | 509 | Нет белка |
2. Ensemble
В геномном браузере Ensemble был найден ген CCT4 и его транскрипты, а также скачено самое длинное выравнивание гена с геном шимпанзе.(Нашлось 2 блока выравнивания, одно в 21787, другое в 168 bp). С помощью infoalign из пакета EMBOSS на kodomo была получена информация о выравнивании в виде html страницы. Строка команды запуска:
infoalign -html -only -name -seqlength -gapcount -diffcount -heading -alignlength Human_Chimp_CCT4.fa -out out.html
Результат можно видеть в Таблице 3. Несложно посчитать, что разница составила приблизительно 1.84% длины. По некоторым данным полногеномные различия человека и обезьяны составляют приблизительно 4% - слегка больше, чем получилось, но учитывая, что сравнивались варианты гена довольно консервативного белка, резульат выглядит правдоподобным.
Name | Sequence Length | Aligned Length | Gap Length | Difference |
---|---|---|---|---|
homo_sapiens_1-21914 | 21787 | 21914 | 127 | 0 |
pan_troglodytes_1-21914 | 21608 | 21914 | 306 | 404 |