Елизавета Карастелина
Факультет биоинженерии и биоинформатики, Московский государственный университет имени Ломоносова, Москва, Россия.
Данная архея была выделена из солёных озёр Гейз(Gaize) и Сянди(Xiadi), находящихся в Тибете, и из засоленной почвы из Синьцзяна(Xinjiang). Запись об архее была опубликована в Pubmed в декабре 2021.
Для данного мини-обзора были исследованы длины белков, расстояния между кодирующими последовательностями на плюс-цепи самой большой хромосомы и процентное соотношение генов с различными особенностями на цепях хромосом
В качестве источника была использована таблица особенностей археи Haloprofundus salinisoli с сайта NCBI (1)
Для анализа данных (1) для составления гистограммы длин белков (2) и гистограммы расстояний между кодирующими последовательностями (3) использовались Google Sheets.
Для получения таблицы, содержащей количество каждого типа особенностей генов археи Haloprofundus salinisoli на каждой цепи всех частей её генома был использован конвейер Bash (4). Затем, для составления таблицы процентного соотношение генов с различными особенностями на цепях хромосом из полученной с помощью Bash таблицы были использованы Google Sheets (5).
С использованием электронных таблиц были вычислены длины белков, закодированных в геноме Haloprofundus salinisoli. Самый короткий белок состоит из 29 аминокислот, а самый длинный - из 1673. Но, поскольку белков длинной 1100-1673 крайне мало, было принято решение объединить их в один столбец. Больше всего белков длинной 140-170 аминокислот. По данной гистограмме можно увидеть распределение белков согласно диапазонам их длин. Их количество на диапазон сначала резко возрастает, а затем постепенно снижается.
С использованием электронных таблиц были вычислены расстояния между последовательными кодирующими последовательностями по плюс-цепи самой большой хромосомы в геноме Haloprofundus salinisoli. Самое короткое расстояние составляет -22 аминокислоты (результат наслаивания генов друг на друга), а самое длинное - из 13969. Но, поскольку расстояний в 5525-13975 крайне мало, было принято решение объединить их в один столбец. Больше всего расстояний находится в диапазона -25-125. По данной гистограмме можно увидеть распределение расстояний между последовательными кодирующими последовательностями по плюс-цепи самой большой хромосомы согласно диапазонам их длин. Их количество на диапазон сначала очень велико, а затем резко падает и продолжает постепенно снижаться.
Были получены процентные соотношения генов с различными особенностями на цепях хромосом в геноме Haloprofundus salinisoli. В каждой цепи больше всего содержится генов, кодирующих последовательности аминокислот (CDS), причем во всех цепях плазмид содержатся только гены, кодирующие последовательности аминокислот. Некодирующая РНК содержится только в плюс-цепи самой большой хромосомы. В обеих цепях самой большой хромосомы содержатся рибосомальная и транспортная РНК, причем в обеих количество рибосомальной РНК больше, чем транспортной. Данная информация о распределении генов с различными особенностями может быть использована для более точечного воздействия на гены с нужными особенностями, например, кодирующие нужный тип РНК.