Геномные браузеры: UCSC genome browser, Ensemble, NCBI Genome Data Viewer

1. UCSC


Выбранный белок - 4 субъединица TRiC/CCT - АТФ-зависимого шаперона, участвующего в фолдинге 10% белков клетки[1] и необходимого для успешного фолдинга актина. Он состоит их двух, симметрично расположенных, колец по 8 субъединиц. [2] Этот белок может проводить фолдинг самостоятельно, но in vivo он взаимодеймтвует с другими шаперонами, вроде Hsp70 и префолдина. Именно апексом CCT4 он связывается с префолдином, который вращается вокруг поверхности электростатического взаимодействия, образованной отрицательно заряженными аминокислоныйми остатками CCT4 и положительно заряженными аминокслотными остатками 4-й и 6-й субъединиц префолдина. Замена аминокислотных остатков CCT4 на глутаминовую кислоту приводит к потери способности связываться с PFD и, как следствие, нарушению протеостаза клетки. [3] Информацию о гене CCT4 можно найти в Таблице 1. На Рис. 2 можно увидеть варианты транскриптов и их геномное окружение, в Таблице 2 - описание первых трёх транскриптов. Информация и изображение были взяты из UCSC genome browser.

Таблица 1. Информация о гене CCT4
Имя гена CCT4
Gencode ID ENSG00000115484.15
Цепь -
Хромосома и плечо Chr2:p15 (Короткое плечо 2-й хромосомы, полоса 15)
Количество альтернативных продуктов 4
Something went wrong :(
Рис. 1. Взамодействие TRiC и PFD через CCT4.(Источник)

Something went wrong :(
Рис. 2. Геномное окружение гена CCT4  из UCSC genome browser
Таблица 2. Альтернативные транскрипты CCT4.
Транскрипт (Gencode ID) ENST00000394440.8 ENST00000544079.2 ENST00000425779.1
Позиция в хромосоме 61,868,085-61,888,656 61,868,125-61,888,671 61,868,432-61,886,082
Количество экзонов 14 13 2
Длина последовательности белка 539 509 Нет белка

2. Ensemble

В геномном браузере Ensemble был найден ген CCT4 и его транскрипты, а также скачено самое длинное выравнивание гена с геном шимпанзе.(Нашлось 2 блока выравнивания, одно в 21787, другое в 168 bp). С помощью infoalign из пакета EMBOSS на kodomo была получена информация о выравнивании в виде html страницы. Строка команды запуска:
infoalign -html -only -name -seqlength -gapcount -diffcount -heading -alignlength Human_Chimp_CCT4.fa -out out.html
Результат можно видеть в Таблице 3. Несложно посчитать, что разница составила приблизительно 1.84% длины. По некоторым данным полногеномные различия человека и обезьяны составляют приблизительно 4% - слегка больше, чем получилось, но учитывая, что сравнивались варианты гена довольно консервативного белка, резульат выглядит правдоподобным.

Таблица 3. Информация о выравнивании, полученная после работы infoalign
NameSequence LengthAligned LengthGap LengthDifference
homo_sapiens_1-21914 21787 21914 127 0
pan_troglodytes_1-21914 21608 21914 306 404