Мини-обзор генома археи Haloprofundus salinisoli

Елизавета Карастелина

Факультет биоинженерии и биоинформатики, Московский государственный университет имени Ломоносова, Москва, Россия.

1 ВВЕДЕНИЕ

1.1 Таксономическое положение Haloprofundus salinisoli [1]:

Домен: Archaea
Царство: Methanobacteriati
Тип: Methanobacteriota
Stenosarchaea group
Класс: Halobacteria
Порядок: Halobacteriales
Семейство: Haloferacaceae
Род: Haloprofundus
Вид: Haloprofundus salinisoli

1.2 Краткое описание археи[2].

Данная архея была выделена из солёных озёр Гейз(Gaize) и Сянди(Xiadi), находящихся в Тибете, и из засоленной почвы из Синьцзяна(Xinjiang). Запись об архее была опубликована в Pubmed в декабре 2021.

1.3 Проведенные исследования

Для данного мини-обзора были исследованы длины белков, расстояния между кодирующими последовательностями на плюс-цепи самой большой хромосомы и процентное соотношение генов с различными особенностями на цепях хромосом

2 МАТЕРИАЛЫ И МЕТОДЫ

2.1 Источники данных

В качестве источника была использована таблица особенностей археи Haloprofundus salinisoli с сайта NCBI (1)

2.2 Методы для исследования длин белков, закодированных в геноме археи Haloprofundus salinisoli и расстояний между последовательными кодирующими последовательностями на плюс-цепи самой большой хромосомы

Для анализа данных (1) для составления гистограммы длин белков (2) и гистограммы расстояний между кодирующими последовательностями (3) использовались Google Sheets.

2.3 Методы для исследования процентного соотношение генов с различными особенностями на цепях хромосом

Для получения таблицы, содержащей количество каждого типа особенностей генов археи Haloprofundus salinisoli на каждой цепи всех частей её генома был использован конвейер Bash (4). Затем, для составления таблицы процентного соотношение генов с различными особенностями на цепях хромосом из полученной с помощью Bash таблицы были использованы Google Sheets (5).

3 РЕЗУЛЬТАТЫ

3.1 Длины белков, закодированных в геноме археи Haloprofundus salinisoli

С использованием электронных таблиц были вычислены длины белков, закодированных в геноме Haloprofundus salinisoli. Самый короткий белок состоит из 29 аминокислот, а самый длинный - из 1673. Но, поскольку белков длинной 1100-1673 крайне мало, было принято решение объединить их в один столбец. Больше всего белков длинной 140-170 аминокислот. По данной гистограмме можно увидеть распределение белков согласно диапазонам их длин. Их количество на диапазон сначала резко возрастает, а затем постепенно снижается.

Число длин белков относительно параметра “Диапозоны”.
Рис. 1. Число длин белков относительно параметра “Диапозоны”. Длина измеряется числом аминокислотных остатков

3.2 Расстояние между последовательными кодирующими последовательностями на плюс-цепи самой большой хромосомы

С использованием электронных таблиц были вычислены расстояния между последовательными кодирующими последовательностями по плюс-цепи самой большой хромосомы в геноме Haloprofundus salinisoli. Самое короткое расстояние составляет -22 аминокислоты (результат наслаивания генов друг на друга), а самое длинное - из 13969. Но, поскольку расстояний в 5525-13975 крайне мало, было принято решение объединить их в один столбец. Больше всего расстояний находится в диапазона -25-125. По данной гистограмме можно увидеть распределение расстояний между последовательными кодирующими последовательностями по плюс-цепи самой большой хромосомы согласно диапазонам их длин. Их количество на диапазон сначала очень велико, а затем резко падает и продолжает постепенно снижаться.

Число расстояний между последовательными кодирующими последовательностями на плюс-цепи самой большой хромосомы относительно параметра 'Диапазон'
Рис. 2. Число расстояний между последовательными кодирующими последовательностями на плюс-цепи самой большой хромосомы относительно параметра "Диапазон"

3.3 Процентное соотношение генов с различными особенностями на цепях хромосом

Были получены процентные соотношения генов с различными особенностями на цепях хромосом в геноме Haloprofundus salinisoli. В каждой цепи больше всего содержится генов, кодирующих последовательности аминокислот (CDS), причем во всех цепях плазмид содержатся только гены, кодирующие последовательности аминокислот. Некодирующая РНК содержится только в плюс-цепи самой большой хромосомы. В обеих цепях самой большой хромосомы содержатся рибосомальная и транспортная РНК, причем в обеих количество рибосомальной РНК больше, чем транспортной. Данная информация о распределении генов с различными особенностями может быть использована для более точечного воздействия на гены с нужными особенностями, например, кодирующие нужный тип РНК.

Таблица 3. Процентное соотношение генов с различными особенностями на цепях хромосом
Процентное соотношение генов с различными особенностями на цепях хромосом

СОПРОВОДИТЕЛЬНЫЕ МАТЕРИАЛЫ

СПИСОК ЛИТЕРАТУРЫ