Выполним это задание с помощью базы данных Pfam.
По идентификатору UniProt SYC_ECOLI найдем описание его доменной организации.
Cхема из Pfam (голубое - low_complexity):![]() |
|||||
Пояснения к схеме: |
|||||
№ | Pfam AC | Pfam ID | Полное название семейства домена | Положение в последовательности белка SYC_Ecoli | Клан |
1. | PF01406 | tRNA-synt_1e | tRNA синтетаз класс I (C) каталитический домен. Это семейство включает только цистеинил - tRNA синтетазы. |
14-314 | аминоацил - tRNA синтетаз I Этот клан состоит из 7 семейств и общим числом доменов 23708. |
2. | PF09190 | DALR domain | DALR домен Этот домен обнаружен в цистеинил-tRNA-синтетазах. |
341-402 | DALR суперсемейство Это антикодон-связывающие домены из разных tRNA синтетаз. Этот клан состоит 2 семейств и общее число доменов в нем 4178. |
Получили файл(формат txt) и файл (формат msf).
Для этого воспользуемся БД InterPro. По идентификатору UniProt найдем описание всех подписей (signatures), интегрированных в InterPro, т.е. имеющих InterPro ID.
Cреди них найдем подпись, которая, на наш взгляд, наиболее отличается от подписей PFAM и может породить иное представление о первичной структуре заданного белка.
Структурные мотивы на данном этапе можно (и даже лучше) опустить.
Была выбрана база данных SPRINT, так изображение мотивов белка наиболее сильно отличалось от полученного в Pfam.
Ни один из мотивов не совпал. InterPro ID этой записи - IPR015803.
Получим изображение 3D-структуры заданного белка, в котором цветом выделены отдельные домены в последовательности.
Откроим страничку Pfam с доменной структурой белка. Выберем кнопку "Structures" в левом меню. В открывшемся списке структур выберем структуру, содержащую, по крайней мере, 2 домена - я выбрала 1li5. Выберем кнопку "View structure" и выберем программу Jmol. Если не повезло (невозможно разобраться в картинке из-за большого количества одинаковых цепей), то щелкните по картинке, в выпавшем меню выберите кнопку "Console" и введите в командное окно команду display *:A.
Рассмотрим изображение и ответим на следующие вопросы:
Структурные домены выделить не возможно, поэтом если рассмотреть просто части структуры, то складчатые слои и в цепи А, и в В принадлежат к tRNA-synt_1e, но этот домен так же состоит и из спиралей. Домен DALR_2 в обеих цепях представлят 2 альфа-спирали.
Откроем страничку Pfam с доменной структурой белка. Выберем страничку с описанием конкретного домена.
|
|
Можно сделать вывод о том, что оба домена встречаются в большинстве своем в бактериях и архибактериях. Возможно предположение, что выполняемая ими функция имела наибольшее значение в одноклеточных организмах.
Открывая страничку с таксономическим деревом Pfam для доменов заданного белка, с помощью команды "Ctrl+F" браузера найдитем таксон Escherichia coli (strain K12), поставив перед названием таксона галочку и выбрав по "View graphically" в правом меню.
№ | PFAM ID | Количество белков в Escherichia coli (strain K12) |
1. | PF01406 | 1 |
2 | PF09190 | 1 |
В Escherichia coli (strain K12) обнаружен только один белок с такой доменной организацией. Можно предположить, что белок выполняет специфическую функцию, поэтому такой набор доменов для него специфичен.
Для каждого из доменов заданного белка рассмотрим варианты доменной организации и подберем наиболее яркие примеры доменных перестроек.
Встречается в сочетаниях с разными доменами, обычно занимает либо N-концевое положение, либо в середине последовательности белка, реже в конце. Иногда домен разрывается другим доменом.
Встречается в основном в сочетании с первым доменом. Обычно занимает С-концевое положение. Чаще всего в последовательности встречается начальная половина последовательности домена.