Практикум 7. UniProt

Выбор белка

С помощью расширенного поиска на сайте UniProt было найдено 2 записи о белковых последовательностях бактерии Leptospira borgpetersenii serovar Ceylonica, о которой идёт речь в миниобзоре.

Поисковой запрос: (taxonomy_id:508536), позволяет найти все записи последовательностей изучаемого организма.

Для расмотрения в рамках практикума был выбран белок Protein translocase subunit SecY. Запись относится к базе данных TrEMBL, то есть она автоматически аннотирована.

Важно отметить, что выбор сделан, опираясь на следующие характеристики: Protein existence, Annotation score.

Protein existence: Inferred from homology. Данная запись означает, что белок не был получен экспериментально, но существуют молекулы, похожие на данную запись, на основе чего можно сделать вывод о предположительном существовании.

Annotation score: 2/5. Данная запись означает, что уровень аннотированности составляет 2/5 (выбор сделан в пользу данного белка, поскольку у второй найденной записи LigB Annotation score: 1/5)

Информация о белке

Protein translocase subunit SecY или Субъединица белковой транслоказы SecY - это белок, образующий поровый канал. Канал закрыт как поровым кольцом, состоящим из гидрофобных остатков SecY, так и короткой спиралью (спираль 2A) на внеклеточной стороне мембраны, которая образует пробку. Пробка, вероятно, движется латерально, позволяя каналу открыться. То есть канал, необходим для транспортировки через мембрану субстрата - полипептидной цепи.

Ген, кодирующий данный белок, называется secY. Белок содержит 409 аминокислотных остатков. Функция: центральная субъединица канала транслокации белка SecYEG

Кластеры похожих белков

Кластер UniRef100 содержит 59 записей. Это значит, что данная последовательность является не уникальной, а достаточно распространённой. Кластеры UniRef90 и UniRef50 содержат соответсвенно 528 и 596 записей. Данный факт говорит нам о том, что похожих белков (то есть отличающихся незначительно) достаточно большое количесво.

Исходя из представленных значений, а также из сильного разброса между UniRef100 и UniRef90 (UniRef50) можно сделать вывод о консервативности белка. То есть 59 записей со 100% идентичностью означает, что у ряда родственных и эволюционно близких организмов данная последовательность не менялась. В то же время большое количество записей с 50% и 90% идентичностью говорит о том, что при расмотрении этой последовательности с эволюционной точки зрения можно сказать, что многие белки родственных организмов почти не меняли аминокислотный состав, то есть исходная последовательность достаточно консервативная.

Поисковые запросы

Поисковый запрос: (protein_name:"Protein translocase subunit SecY")

Рассуждения и выводы: в базе данных UniProtKB нашлость 43678 записей с таким же названием. Это говорит о распространённости белка, о том, что это не единичный фермент, необходимый конкретному организму, а более распространённая последовательность. Функция скорее всего универсальна и фундаментально важна.

Поисковый запрос: (gene:secY) AND (existence:1)

Рассуждения и выводы:в базе данных UniProtKB нашлость 13 записей белков, экспрессируемых с данного гена с экспериментальным подтверждением их существоания. Это полезно проверить, поскольку запись была аннотирована автоматически. Данные результаты говорят нам о том, что secY активно экспрессируемый ген.

Поисковый запрос: (protein_name:"Protein translocase subunit SecY") AND (taxonomy_id:2)

Рассуждения и выводы: в базе данных UniProtKB нашлость 40404 записей с таким же названием белка среди Bacteria (Eubacteria)

Поисковый запрос: (protein_name:"Protein translocase subunit SecY") AND (taxonomy_id:2157) нашел 2746 записей с таким же названием белка, у Archaea.

Поисковой запрос: (protein_name:"Protein translocase subunit SecY") AND (taxonomy_id:1928008) выдаёт 0 результатов, что говорит нам о том, что данный белок среди Эукариот не встречается, возможно есть похожий с такой же функцией, но он называется по другому.

Поиск источника аннотации

Штам, для которого получена данная запись называется "Piyasena", ECO:0000313. Данный код доказательства означает, что это тип импортированной информации, который используется в автоматическом утверждении.

Данная млекула является многопроходным мембранным белком, ECO:0000256. Данный код доказательства является свидетельством сопоставления с моделью последовательности, используемым в автоматическом утверждении.

Данный белок относится к семейству SecY/SEC61-alpha, включающему в себя SecY(бактерии и археи) и SEC61(у эукариот), ECO:0000256 (разобран выше).

Основной источник, в котором можно найти более детальную информацию о данном белке: "Conservation of the S10-spc-alpha locus within otherwise highly plastic genomes provides phylogenetic insight into the genus Leptospira." Victoria B., Ahmed A., Zuerner R.L., Ahmed N., Bulach D.M., Quinteiro J., RA Hartskeerl R.A.