Абашкина А.И.
Факультет биоинженерии и биоинформатики, Московский Государственный Университет имени М.В.Ломоносова
Данный мини-обзор представляет из себя работу с геномом галофильной археи Halorubrum salinarum с использованием программирования на языке Python и функционала электронных таблиц.
Halorubrum salinarum является экстремафильной археей, способной выживать, даже в практически в нас>ид был обнаружен в 2015 в бассейне для выпаривания соли в Болинао, Пангасинан, Филиппины. Hbt. salin>Так же Hbt. salinarum продуцирует большое количество разнообразных галоцинов. Галоцины - это белковые>Материалы и методы
Данные по геному исследуемой археи были взяты с сайта Национального Центра Биотехнологической информа>Для анализа данных использовались электронные таблицы Google Sheets и программы, написанные на языке
Геном Hbt. salinarum состоит из основной хромосомы, состоящей из 2937429 пар оснований и двух плазмиды размером 247617 и 155204 п.н. Геном очень богат G-C (62,56%). Высокое содержание GC в геноме повышает стабильность в экстремальных условиях.
С помощью fasta-файла последовательности генома [2] и программы [3] можно определить нуклеотидный состав ДНК (Таблица 2). Данные показывают, что для исследуемой бактерии выполняется второе правило Чаргаффа – число букв A примерно равно числу букв T, а число букв G примерно равно числу букв C в последовательности одной цепочки геномной ДНК.
В электронных таблицах была построена гистограмма длин белков (Диаграмма 1) и подсчитаны некоторые статистические параметры для этого распределения [4].
Первое, что было сделано - это оставление гистограммы длин белков к их количеству (Диаграмма 1). Из гистограммы видно, что наибольшее количество белков (436) имеют длину в диапазоне 100-150.
Затем с помощью функций таблиц был найден самый короткий белок. Это оказался гипотетический белок, длинной в 40.
Аналогично был найден самый длинный белок. Это белок Системы секреции IV типа, длинной в 2407 и. Он состоит из 12 субъединиц.
Всего в геноме 54 генов РНК , что составляет 1.78% от всех генов. Генов тРНК – 48, рРНК – 6 (Таблица 6). В геноме представлено по два гена каждого типа рРНК, образующих субъединицы рибосом прокариот (5S, 16S, 23S). Вероятно, они представлены в одинаковой кратности для соотношения их продуктов 1:1:1.
Работа состоялась благодаря биоинженерии и биоинформатики МГУ им М.В. Ломоносова.
И отдельно хочу поблагодарить Кушнареву Дарью, Кузнецова Илью, Брылёву Анастасию и Смельницкую Арину за помощь и вдохновение.
Список литературы
1) Ghanmi, F., Carré-Mlouka, A., Zarai, Z., Mejdoub, H., Peduzzi, J., Maalej, S., & Rebuffat, S. (2019). The extremely halophilic archaeon Halobacterium salinarum ETD5 from the solar saltern of Sfax (Tunisia) produces multiple halocins. Research in Microbiology.
2) Статья из журнала International Journal of Systematic and Evolutionary Microbiology. Halorubrum salinarum sp. nov., an extremely halophilic archaeon isolated from a saturated brine pond of a saltern
3) https://en.wikipedia.org/wiki/Halocin
4) Madhan R. Tirumalai, Jason T. Kaelber, Donghyun R. Park, Quyen Tran, and George E. Fox (2020 Oct)Cryo‐electron microscopy visualization of a large insertion in the 5S ribosomal RNA of the extremely halophilic archaeon Halococcus morrhuae