Обучение работы с базой данных UniProt
Петренко Павел
Факультет биоинженерии и биоинформатики, Московский Государственный Университет имени М.В.Ломоносова
1. Выбор белка
Моей бактерией была Moraxella ovis. Сначала в поисковой стороке я ввёл название своей бактерии (Moraxella ovis), а затем уточнил поиск названием белка, который я достаточно часто встречал при подготовке миниобзора бактерии и сравнении родственных микроорганизмов Moraxella. Выбранным белком стал Universal stress protein.
2. Информация о белке
Название: Universal stress protein
Перевод названия: Универсальный стрессовый белок
Длина (в аминокислотах): 149
Масса (в Дальтонах): 16,294
Функции: стоит заметить, что данный белок был выявлен с помощью онтологического моделирования, из-за чего точные функции белка назвать трудно, так как онтологический метод подразумевает сравнивание участков генов и выявления подобных структур (в данном случае это подобные белки из одной группы, называемой Universal stress proteins), такие белки ещё не так хорошо изучены. Тем не менее, рассматривая кластеры UniRef, можно заметить, что универсальный стрессовый белок является компонентом цитоплазмы, а его функция - защита микроорганизма от стрессов окружающей среды.
3. Поисковые запросы
1. (taxonomy_id:29433) AND (existence:3) - 1083 результата
Поиск белков, наличие которых было выявлено из гомологии, как и у исследуемого белка. В результате поиска получено 1083 белка, что является достаточно большим результатом, из чего можно сделать вывод, что у близкородственных видов Moraxella имеются чёткие ортологии, их геном сильно схож.
2. (taxonomy_id:475) AND (protein_name:"Universal stress protein") - 24 результата
Выявление, в скольки видах рода Moraxella присутствует универсальный стрессовый белок. Поиск показал, что 13 из 19 установленных видов рода Moraxella, а также два неопределённых вида, имеют универсальный стрессовый белок (некоторые имеют несколько его копий), что ещё раз доказывает схожесть генома представителей рода Ovis и наличие чётких ортологий.
3. (uniref_cluster_50:UniRef50_A0A1T0A5G2) AND (length:[150 TO 150]) - 11 результатов
(uniref_cluster_50:UniRef50_A0A1T0A5G2) AND (length:[153 TO 153]) - 66 результатов
Исследование того, сколько белков из кластера UniRef50 имеют длину репрезентативной последовательности (наиболее хорошо аннотированной последователности) и сравнение с группой последовательностей длиной 153 аминокислоты и кластера UniRef50, которые являются наиболее часто встречающимися. При дальнейшем сравнении репрезентативной последовательности с последовательностями, состоящими из 153 аминокислот, видно, что основное сходство составляют первые 150 аминокислотных остатков, а последние 3 остатка не несут особого смысла и могут легко заменяться.