Для выбора на обзор белка галобактерии Natribaculum luteum я воспользовалась расширенным поиском базы данных UniProtKB. Выбрав поиск по таксономическому положению, я ввела видовое название моей археи и ее id(1586232). Таким образом я получила ровно одну запись, принадлежащую бета-субъединице ДНК-зависемой РНК-полимеразы(DNA-directed RNA polymerase subunit beta, entry name - A0A0A7RBW6_9EURY). Запись относится к автоматической базе данных TrEMBL, то есть была создана компьютерной программой и белок не выделялся экспериментально. Однако так как у данной записи рейтинг аннотации составляет удовлетворительные 3 из 5 и запись была создана по принципу гомологии(имеет пометку Inferred from homology), я решила все-таки не искать дальше.
ДНК-зависимая РНК-полимераза катализирует транскрипцию ДНК в РНК, используя четыре рибонуклеозидтрифосфата в качестве субстратов. Длина данного белка составляет 609 аминокислот, а молекулярная масса - 67855 дальтон. Он может быть найден в цитоплазме, где проявляет каталитическую активность, используя в качестве кофактора ион Zn(2+). Реакция приведена ниже:
RNA(n) + a ribonucleoside 5'-triphosphate = RNA(n+1) + diphosphate
1)Поиск в UniRef по таксонамическому id и идентичности последовательности, равной 50%
При определении кластеров похожих белков для ДНК-зависимой РНК-полимеразы Natribaculum luteum я получила результат с размером 1013 в кластере на 50%. Цифра показалась мне внушительной, поэтому я сделала следующий вывод: данный белок широко распространен, и его последовательность неконсервативна. Поэтому я решила в UniRef изучить организмы, чьи белки попали в этот кластер. Помимо родственных архей, я нашла по этому поиску Citricoccus sp. CH26A, грамположительную бактерию, что подтверждает универсальность последовательности белка. Однако среди эукариот не было найдено подобных белков.
2)Поиск в UniProtKB по названию белка и разным суперцарствам
Далее я решила посмотреть, где чаще встречается бета-субъединица ДНК-зависимой РНК-полимеразы. Было получено 54073 записей для эукариот, 79300 для бактерий и 2911 для архей. Скорее всего полученные результаты связаны с тем, что в базу данных банально загружено значительно больше последовательностей бактерий, нежели других суперцарств.
3)Поиск в UniProtKB по названию белка и классу Halobacteria
Было получено 614 записей сходной длины. Представители данного класса географически близко расселены, что подтверждает тот факт, что у такого большого количества видов обнаружились сходные белки. Также это говорит о большом межвидовом сходстве внутри данного класса.