Предсказание топологии трансмембранных участков в АТФ/АДФ-антипортере. Cравнение предсказания с данными о белке-прототипе с известной 3D-структурой

Построение парного выравнивания исследуемого белка и прототипа

Белок с идентификатором Uniprot ID Q8AYM3 был извлечен из UniProt. Это белок курицы (Gallus gallus), АТФ/АДФ-антипортер. Его прототип - белок быка (Bos taurus с AC P02722 (PDB ID 1OKC). Его последовательность из PDB отличается от последовательности из Uniprot только отсутствием первого метионина, что не влияет на нумерацию в PDB-файле.

Последовательности имеют одинаковую длину (298 а.о.), программой needle выровнены по всей длине без гэпов. Процент идентичности составляет 89.9, процент сходства - 96.0.

Оценка качества предсказания трансмембранных сегментов с помощью TMHMM

На построенном выравнивании были отмечены трансмембранные сегменты, которые описаны в базе данных OPM для белка-прототипа ADT1_BOVIN, у которого известна 3D-структура. Затем с помощью программы TMHMM были предсказаны трансмембранные сегменты в исследуемом белке Q8AYM3_CHICK, и результаты этого предсказания также отражены на выравнивании.

Результат работы программы TMHMM приведен здесь. Полученное выравнивание в формате Clustal приведено здесь.

На выравнивании, которое приведено ниже, последовательность "OPM" отражает данные соответствующей базы данных о белке ADT1_BOVIN, а последовательность "TMHMM" - предсказание сервиса TMHMM для белка Q8AYM3_CHICK. Зелеными буквами "H" обозначены трансмембранные участки, красными символами "+" - петли, лежащие в матриксе митохондрий, а синими символами "-" - участки в межмембранном пространстве. Из полученных данных видно, что предсказания TMHMM и данные базы OPM практически совпадают для 3 трансмембранных участков, в то время как еще 3 в предсказании TMHMM отсутствуют. Однако на графике постериорных вероятностей, выдаваемом TMHMM, можно заметить незначительные повышения вероятности быть в мембране для этих 3 участков.

Количественное сравнение полученного предсказания и данных OPM описано в таблице ниже.

Результаты предсказания топологии мембранного белка Q8AYM3_CHICK
Характеристика Значение
Всего а.о. 298
Остатки, предсказанные как локализованные в мембране (всего) 69
Предсказано правильно (TP) 68
Предсказанно ошибочно (FP) 1
Не предсказано правильно (TN) 152
Не предсказанно ошибочно (FN) 77
Чувствительность = TP / (TP+FN) 0.47
Специфичность = TN / (TN+FP) 0.99
Точность = TP / (TP+FP) 0.99
Сверхпредсказание = FP/ (FP+TP) 0.01
Недопредсказание = FN / (TN+FN) 0.34