Сравнение характеристик белков на разных цепях
Мною была исследован геном бактерии Zobellia galactanivorans, содержащийся в файле NC_015844.
Таблицу, содержащую результаты можно скачать по этой ссылке
Таблица 1. Главные характеристики белков Zobellia galactanivorans
Mean protein length | 351,31 |
Median protein length | 287 |
Minimum protein length | 25 |
Maximum protein length | 6203 |
Mean intergenic distance | 105,23 |
Median intergenic distance | 62 |
Maximum intergenic distance | 8836 |
CDS on direct strand | 2347 |
CDS on reverse strand | 2385 |
Overlapping genes | 511 |
Mean "direct "protein length | 1017,66 |
Median "direct"protein length | 825 |
Mean "reverse" protein length | 1095,6 |
Median "reverse"protein length | 912 |
Особый интерес представило соотношение характеристик белков на прямой и обратной цепях ДНК. Как и следовало ожидать, они весьма близки. Это лишний раз подчеркивает то, что кодирующая цепь выбирается учеными по принципу удобства, а не из каких-то научных соображений. Для большей убедительности ниже приведен график(рис.1), отображающий гистограмму распределения длин белков, закодированных на прямой и обратной цепях( длины белков - в аминокислотах). Нетрудно заметить, что количества белков одного размера, кодируемых на разных цепях, практически совпадают.
Рис.1. Столбчатая диаграмма, изображающая гистограмму распределения длин белков, закодированных на прямой и обратной цепях
На рис. 2 приведена более детальная столбчатая диаграмма, изображающая гистограмму распределения длин белков, при этом взяты не все белки, а те, у которых длина не больше удвоенного среднего арифметического длин всех белков.
Рис.2 Более детальная столбчатая диаграмма, построенная для белков, длина которых меньше удвоенного среднего арифметического длин всех белков