Для данного задания в базе данных OPM был выбран токсин, который относится к лектинам, то есть белкам, способным специфично связывать остатки углеводов. Выбранный протеин секретируется морским огурцом. Главной функцией белка является защита организма от хищников и чужеродных организмов.
Ниже предствалена информация о выбранном белке:
Согласно данным, данный белок состоит из 7 субъединиц, каждая из которых имеет два трансмембранных участка: 1( 318- 330), 2( 340- 353). Также было проверено толщина трансмембранной части при помощи программы Pymol, она действительно составила 33.8 Ангстрем.
Ниже представлены два изображения: из базы данных OPM и сделанное при помощи Pymol. На данных изображениях n-сторона мембраны со стороны синего слоя, р-сторона - красного.
В данном задании нужно было предсказать трансмембранные участки по последовательности белка. В качестве альфа-спирального белка был взят предложенный белок - YQEW_BACSU, а бета-листового - Q868M7_CUCEC. Результат несколько удивил. Для альфа-спирального белка программа хорошо определила трансмембранные участки и участки внутри и снаружи клетки. Однако для выбранного бета-листового белка такого хорошего результата не наблюдалось, это можно объяснить двумя факторами: выбранный белок - токсин, поэтому в обычном состоянии он находится просто вне клетки, выбранный белок состоит из семи субъединиц, а fasta-файл одержит последовательность одной из них, поэтому для такой последовательности не может быть характерно трансмембранное расположение. Стоит заметить, что для токсина хорошо определилась сигнальная последовательность, что характерно для данного типа белков.
Ниже предствалены ссылки на все файлы:
Также ниже представлена визуализация полученных результатов. Первое изображение соответствет YQEW_BACSU, второе - Q868M7_CUCEC.
В данном задании требовалось предсказать положение белка в мембране. Для этого был взят уже упомянутый ранее альфа-спиральный белок. Этот протеин является симпортером для натрия и фосфата. Как было выяснено в прошлом пункте, N-конец данного белка обращен вне клетки. Сам протеин был обнаружен в Bacillus subtilis, данный организм является грамм-положительной бактерией. Также из записи в UniProt было вяснено, что белок расположен именно в клеточной мембране, а не в какой-либо другой. Соответственно именно эти параметры и были выбраны при запуске PPM.
По итогу работы программы были получены следующие участки вторичной структуры, расположенные в мембране: 1( 4- 25), 2( 83- 101), 3( 107- 121), 4( 126- 150), 5( 170- 186), 6( 187- 199), 7( 205- 225), 8( 237- 256), 9( 271- 296). Данные результаты отличаются от тех данных, которые представлены в UniProt, однако эти отличия не очень большие, а также стоит заметить, что внутри мембраны может быть не только альфа-спираль, но и просто цепочка аминокислот, что, видимо, не учитывалось в результатах предсказания.
Ниже представлено изображение предсказанного расположения. Для облегчения рассмотрения изображение модели было изменено.На данном изображении n-сторона мембраны со стороны синего слоя, р-сторона - красного.
Для начала заметим, что количество трансмембранных участков, определенных прогрммой DeepTMHMM, равно 11, а для PPM это число равно 9. Что уже говорит о различиях результатов. после более подробного изучения было обнаружено то, что первая программа по какой-то причине разделяет два участка на отдельные, чего не наблюдается в предсказании по структуре. Очевидно, что предсказание по структуре будет более точным, нежели просто по последовательности. Тем более при предсказании по структуре программе сообщался тип мембраны, то есть была более точно известна толщина мембранного слоя. Как уже говорилось ранее, при сравнении с информацией, представленной в UniProt, также возникли несовпадения, однако результат предсказания по структуре все же был гораздо ближе к найденным данным.
Что касается кчества структуры, используемой в предсказании, то его можно считать очень высоким. Практически во всех участках AlphaFold уверен более 90%, неуверенность у программы вызывают частки без вторичной структуры, что очевидно. Качество предсказанной структуры напрямую должно влиять и на качество предсказания расположения белка в мембране, так как длина вториных структур белка зависит от количества минокислот вовлеченных в их формирование, а сама эта длина помогает определить и расположение белка.
В данном задании нужно было найти информацию о рассмотренных в данном практикуме белках в базе данных TCDB. Для обоих белков были найдены записи в базе данных. На страницах белков можно найти их длину, массу, организм, последовательность, а также можно получить информацию по трансмембранным участкам. Еще из записей белков можно определить код по TC-системе.