На страницу четвертого семестра


Мембранные белки



  1. Построение парного выравнивания исследуемого белка и заданного прототипа
    AC исследуемого белка и белка-прототипа: Q65YQ3 и P47863, соответственно. PDB ID белка прототипа - 2D57. В банке данных Uniprot были получены данные последовательности (Save в поле Result options, далее Save with view: FastaSeqs).
    Последовательности белка-прототипа из банков Uniprot и PDB могут различаться, поэтому мы получили последовательность белка из PDB (Download Files: Fasta Sequence) и провели выравнивание поcледовательностей белка c AC P47863 (AQP4_RAT):
    needle 2D57.fasta P47863.fasta
    В результате было получено выравнивание: здесь. Последовательности действительно идентичны только на 93.2%, у белка из банка PDB нет N-концевого фрагмента длиной в 28 аминокислотных остатка, который, вероятно, не закристаллизовался и т.д.
    Проводим выравнивание последовательностей белка AQP4_RAT из PDB и белка с AC Q65YQ3 (Q65YQ3_CHICK), по умолчанию оставляем штраф за открыте гэпа 10.0, штраф за продолжение гэпа 0.5:

    needle Q65YQ3.fasta 2D57.fasta msf -aformat3 msf, где -aformat3 msf формат выравнивания на выходе, в данном случае msf.

    Полученное выравнивание находится в файле marking.msf. Из Score report узнаем, что процент идентичности 78%, процент сходства 85%. В целом высокие показатели, при этом здесь не учитывается N-концевой фрагмент аквапорина-4 из крысы. Если провести выравнивание последовталеьностей, полученных из Uniprot, то процент идентичности и сходства станут выше - 81.2% и 87.2%, соответственно (выравнивание здесь)
    Высокие проценты идентичности и сходства (причем, отличия данных белков создаются в основном зачет "утерянного" N-конца AQP4_RAT) позволяют на основании расположения трансмембранных доменов для аквапорина из крысы (делать предположения относительно их положения у аквапорина из курицы.
    В PDB находится последовательность, начинающаяся с 23-его аминокислотного остатка, в отличие от UniProt, где нумерация начинается с первого аминокислотного остатка.

  2. Разметка мембранных сегментов на выравнивании
    В базе данных OPM (Orientations of Proteins in Membranes database) по идентификатору PDB 2D57 мы нашли описание оренитации белка AQP4_RAT в мембране. В программе GeneDoc мы на полученном раннее выравнивании добавили строку OPM (Import->Text->Clipboard) в ней отметили через "H" - мембранные сегменты, знком "+" - цитоплазматические петли, знаком "-" - обращенные во внеклеточное пространство петли; зеленым цветом мы отметили совпадающие амнокислотные остатки мембранных сегментов, красным цветом - несовпадающие в мембранных сегментах аминокислотные остатки, коричневым цветом - совпадающие остатки цитоплазматических петель, оранжевым цветом - несовпадающие и синим - совпадающие аминокислотные остатки, обращенных во внеклеточное пространство петель, желтым цветом - несовпадающие аминокислотные остатки в таких петлях. Также, здесь тильдами обознаены те участки последовательности аквапорина из крысы, которые, как указано в документе PDB (вкладка Sequence details): "c отсутствующей информацией об их структуре" (residues have no structural information). Так как в OPM используется последовательность из PDB, то, соответственно, для этих участков информации нет.
    Файл marking1.msf
    На выравнивании видно, что 5 мембранных сегментов из 8 полностью идентичны у данных белков. Если аминокислотные остатки и отличаются в позиции, то это всегда остатки, схожие по свойствам (кроме одного случая - треонин и лейцин).

  3. Предсказание топологии белка Q65YQ3_CHICK с помощью наиболее популярной программы (TMHMM)
    Предсказание топологии белка Q65YQ3_CHICK осуществлялась с помощью сервера TMHMM.
    После введения в поле запроса имени файла с последовательностью белка Q65YQ3_CHICK из мы получили следующую страницу с результатами: prediction.htm. Здесь показаны вероятности того, что данный аминокислотный остаток входит в состав трансмембранного домена, петли, обращенной в цитоплазму, или во вне.
    В программе GeneDoc в полученное раннее выравнивание мы добавили строку TMHMM, где, используя те же обозначения, отметили предсказанные данной программой участки. Зеленым цветом мы отметили првильно предсказанные аминокислотные остатки (FP); коричневым - остатки, которые предсказаны как мембранные, но согласно данным OPM таковыми не являются (FP); синим - остатки, входящие в мембранные сегменты согласно OPM, но не предсказанные TMHMM (TN); желтым - правильно не предсказанные аминокислотные остатки, не входящие в мембранные сегменты (FN). Тильдами опять обозначены участки с "отсутствующей информацией об их структуре". Данное выравнивание мы сохранили в виде текстового файла формата Clustal: marking2.txt. Выравнивание в формате HTML находится здесь

  4. Оценка качества предсказания
    Объединим полученные данные относительно предсказания, произведенного программой TMHMM, в таблицу (для подсчета была написана программа):

      Число аминокислотных остатков
    Всего а.к. остатков 224
    Остатки, предсказанные как локализованные в мембране (всего) 139
    Правильно предсказали (true positives, TP) 120
    Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) 19
    Правильно не предсказали (не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) 58
    Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) 27
    Чувствительность (sensivity) = TP / (TP+FN) 0,82
    Специфичность (specificity) = TN / (TN+FP) 0,75
    Точность (precision) = TP / (TP+FP) 0,86
    Сверхпредсказание = FP/ (FP+TP) 0,14
    Недопредсказание = FN / (TN+FN) 0,32


    Таким образом, программа TMHMM с одной стороны неплохо справилась с работой (довольно высокие значения специфичности, то есть доли аминокислотных остатков, которые входят в петли, и были предсказаны; и чувствительности - доля верно предсказанных аминокислотных остатков среди тех, которые по данным OPM входят в трансмембранные домены), с другой стороны - недопредсказала два домена (высокое значение недопредсказания). Причем на графике (странница результатов TMHMM) данные два домена "уверенно" указываются, как не трансмембранные, так как аминокислотные остатки имеют вероятности того, что они входят в мембранные петли, почти равные 0.
    Если говорить о том, как данный метод предсказывает ориентацию петель, то N-концевой участок с очень высокой вероятностью (0.99819) определяется как обращенный в цитоплазму. Более того, предполагается, что на этом конце сигнальная последовательность (с помощью нее происходит узнавание и связывание с SRP-частицей, далее связывание этой частицы с ЭПР, открытие канала, и прохождение сигнальной последовательности с пептидной цепочкой через мембрану ЭПР). Возможно, как казалось, остутствующая у белка-прототипа часть N-конца, это сигнальная последовательность, которая у зрелого белка отщепляется.
    Из-за пропущенных трансмембранных доменов данные об ориентация петлей, TMHMM не совпадет с данными OPM.




©Шахбатян Римма Рубеновна