Скоморохов Глеб Егорович
Московский Государственный Университет имени М. В. Ломоносова,
факультет биоинженерии и биоинформатики
Изучаемый организм принадлежит к домену Bacteria, типу Bacillota, классу Bacilli, порядку Lactobacillales, семейству Lactobacillaceae, роду Liquorilactobacillus. Проще говоря, к известным молочнокислым бактериям, используемым в производстве одноимённой пищевой продукции.
Рис. 1 Гистограмма длин белков
Гистограмма показывает, что большая часть белков имеет длину 0-500 аминокислотных остатков.
Рис. 2 Стоп-кодоны генов
Рис. 3 Стоп-кодоны псевдогенов
Как видно из гистограмм, у генов преобладают стандартные стоп-кодоны TAA, TAG, TGA, преобладает первый из них.
У псевдогенов, напротив, большое разнообразие стоп-кодонов, но TAA, TAG, TGA также встречаются чаще всего. Это может быть связано с тем, что псевдогены подвергались мутациям.
Рис. 4 Частота встречаемости аминокислот в геноме бактерии
Можно заметить, что чаще всего встречается Лейцин. Количество лейцина в геноме составляет 69958, что составляет 10.93% всего генома.
Рис.5 Наборы из 3 аминокислот, встречающиеся в геноме более 200 раз
Во всех найденных наборах присутствует Лейцин, в большинстве из них содержат 2 и более Лейцина. Это говорит о необходимости Лейцина для создания неких общих структур у белков. Это объясняет результаты первой части 3.3.