С помощью расширенного поиска на сайте UniProt было найдено 2 записи о белковых последовательностях бактерии Leptospira borgpetersenii serovar Ceylonica, о которой идёт речь в миниобзоре.
Поисковой запрос: (taxonomy_id:508536), позволяет найти все записи последовательностей изучаемого организма.
Для расмотрения в рамках практикума был выбран белок Protein translocase subunit SecY. Запись относится к базе данных TrEMBL, то есть она автоматически аннотирована.
Важно отметить, что выбор сделан, опираясь на следующие характеристики: Protein existence, Annotation score.
Protein existence: Inferred from homology. Данная запись означает, что белок не был получен экспериментально, но существуют молекулы, похожие на данную запись, на основе чего можно сделать вывод о предположительном существовании.
Annotation score: 2/5. Данная запись означает, что уровень аннотированности составляет 2/5 (выбор сделан в пользу данного белка, поскольку у второй найденной записи LigB Annotation score: 1/5)
Protein translocase subunit SecY или Субъединица белковой транслоказы SecY - это белок, образующий поровый канал. Канал закрыт как поровым кольцом, состоящим из гидрофобных остатков SecY, так и короткой спиралью (спираль 2A) на внеклеточной стороне мембраны, которая образует пробку. Пробка, вероятно, движется латерально, позволяя каналу открыться. То есть канал, необходим для транспортировки через мембрану субстрата - полипептидной цепи.
Ген, кодирующий данный белок, называется secY. Белок содержит 409 аминокислотных остатков. Функция: центральная субъединица канала транслокации белка SecYEG
Кластер UniRef100 содержит 59 записей. Это значит, что данная последовательность является не уникальной, а достаточно распространённой. Кластеры UniRef90 и UniRef50 содержат соответсвенно 528 и 596 записей. Данный факт говорит нам о том, что похожих белков (то есть отличающихся незначительно) достаточно большое количесво.
Исходя из представленных значений, а также из сильного разброса между UniRef100 и UniRef90 (UniRef50) можно сделать вывод о консервативности белка. То есть 59 записей со 100% идентичностью означает, что у ряда родственных и эволюционно близких организмов данная последовательность не менялась. В то же время большое количество записей с 50% и 90% идентичностью говорит о том, что при расмотрении этой последовательности с эволюционной точки зрения можно сказать, что многие белки родственных организмов почти не меняли аминокислотный состав, то есть исходная последовательность достаточно консервативная.
Поисковый запрос: (protein_name:"Protein translocase subunit SecY")
Рассуждения и выводы: в базе данных UniProtKB нашлость 43678 записей с таким же названием. Это говорит о распространённости белка, о том, что это не единичный фермент, необходимый конкретному организму, а более распространённая последовательность. Функция скорее всего универсальна и фундаментально важна.
Поисковый запрос: (gene:secY) AND (existence:1)
Рассуждения и выводы:в базе данных UniProtKB нашлость 13 записей белков, экспрессируемых с данного гена с экспериментальным подтверждением их существоания. Это полезно проверить, поскольку запись была аннотирована автоматически. Данные результаты говорят нам о том, что secY активно экспрессируемый ген.
Поисковый запрос: (protein_name:"Protein translocase subunit SecY") AND (taxonomy_id:2)
Рассуждения и выводы: в базе данных UniProtKB нашлость 40404 записей с таким же названием белка среди Bacteria (Eubacteria)
Поисковый запрос: (protein_name:"Protein translocase subunit SecY") AND (taxonomy_id:2157) нашел 2746 записей с таким же названием белка, у Archaea.
Поисковой запрос: (protein_name:"Protein translocase subunit SecY") AND (taxonomy_id:1928008) выдаёт 0 результатов, что говорит нам о том, что данный белок среди Эукариот не встречается, возможно есть похожий с такой же функцией, но он называется по другому.
Штам, для которого получена данная запись называется "Piyasena", ECO:0000313. Данный код доказательства означает, что это тип импортированной информации, который используется в автоматическом утверждении.
Данная млекула является многопроходным мембранным белком, ECO:0000256. Данный код доказательства является свидетельством сопоставления с моделью последовательности, используемым в автоматическом утверждении.
Данный белок относится к семейству SecY/SEC61-alpha, включающему в себя SecY(бактерии и археи) и SEC61(у эукариот), ECO:0000256 (разобран выше).
Основной источник, в котором можно найти более детальную информацию о данном белке: "Conservation of the S10-spc-alpha locus within otherwise highly plastic genomes provides phylogenetic insight into the genus Leptospira." Victoria B., Ahmed A., Zuerner R.L., Ahmed N., Bulach D.M., Quinteiro J., RA Hartskeerl R.A.