Одним из эффективных инструментов познания живой природы является анализ генетической информации её представителей. В своей работе я обозреваю некоторые основные свойства генома и протеома фитопатогенной бактерии Spiroplasma citri, пользуясь знаниями и умениями, полученными в первом семестре.
Я выяснил, что белок-кодирующие последовательности с небольшим предпочтением кодируются в одном направлении (в таблице особенностей соответствует “+”). Второе правило Чаргаффа почему-то не выполняется для генома Spiroplasma citri.
SPIROPLASMA CITRI, CITRUS STUBBORN DISEASE, ФИТОПАТОЛОГИЯ, ГЕНОМ БАКТЕРИИ
Spiroplasma citri является сельскохозяйственным вредителем. Это паразит растений рода Цитрусовые, вызывающий, так называемую, stubborn disease of citrus. Симптомы: обесцвеченные плоды аномальной формы уменьшенного размера, листья обесцвеченные и аномальной формы, растение в общем подавлено, образуется «метла ведьмы».
Бактерия распространена в Африке, Восточной Азии, Северной Америке, на Новой Зеландии, в южной части Европы, но не в Южной Америке. Spiroplasma citri подробно изучена в связи с её сельскохозяйственным значением. Это отражено на странице бактерии на сайте международного центра агрокультуры и биологических наук. [1]
Типичным для представителей рода Spiroplasma является отсутствие клеточной стенки, паразитический образ жизни, спиральная морфология клетки. [2] У S. citri 1 хромосома, длина генома 1,6 млн. п.н. В геноме с которым я работал также приведены последовательности двух плазмид.
Систематическое положение:
Я анализировал последовательность генома (сопроводительный материал 1) и таблицу признаков генома(сопроводительный материал 2) Spiroplasma citri при помощи сервисов Google Colaboratory и Google Таблицы. В Google Colaboratory я написал программы на языке Python.
Для работы с протеомом я пользовался стандартными функциями Google Таблиц:
Для статистического анализа я использовал критерий χ-квадрат в силу его простоты, я постарался соблюсти правомерность его применения в своей работе, однако в результате я не уверен.
Распределение CDS (белок-кодирующих последовательностей), псевдогенов, генов разных типов РНК представлено в таблицах 2 и 3.
На прямой цепи встречается 908 CDS, на обратной цепи 778. Я принял за нулевую гипотезу, что отличие в количестве незначительно. Применил критерий 2 χ для уровня значимости 0,05: ожидаемые количества белков на обеих цепях - среднее арифметическое - 843. 2 χ = 10,024. А критическое значение при уровне значимости 0,05 равно 3,841. Наблюдается сильное превышение порога, значит следует отвергнуть нулевую гипотезу как маловероятную. Количество белков, закодированное на прямой и обратной цепи значительно различается.
Тип | Количество на прямой цепи | Количество на обратной цепи |
---|---|---|
CDS | 908 | 778 |
псевдогены | 130 | 113 |
tRNA | 12 | 20 |
rRNA | 3 | 0 |
tmRNA | 0 | 1 |
SRP_RNA | 2 | 0 |
Название плазмиды, тип последовательности | Количество на прямой цепи | Количество на обратной цепи |
pSCI15 CDS: | 2 | 12 |
pSCI15 псевдогены: | 2 | 3 |
pSCI26 CDS: | 11 | 3 |
pSCI26 псевдогены: | 3 | 2 |
Геном имеет длину 1599709 нуклеотидов в цепи ДНК единственной основной хромосомы, также есть две плазмиды, названные plasmid pSCI15, длиной 14987 нуклеотидов и plasmid pSCI26, длиной 26182 пар оснований. Названия, длины и CG-состав цепей днк представлен в таблице 4.
Название цепи ДНК | Количество нуклеотидов в ней | Доля нуклеотидов G и C в составе |
NZ_CP013197.1 Spiroplasma citri strain R8-A2 chromosome, complete genome | 1599709 | 0.2556 |
NZ_CP013199.1 Spiroplasma citri strain R8-A2 plasmid pSCI15, complete sequence | 14987 | 0.2463 |
NZ_CP013198.1 Spiroplasma citri strain R8-A2 plasmid pSCI26, complete sequence | 26182 | 0.2279 |
Также я проверил нуклеотидный состав генома (вместе с плазмидами) и соблюдение второго правила Чаргаффа. Нуклеотидов кроме A, T, G, C в геноме нет, встречаемость каждой буквы в последовательности генома приведена в таблице:
A | T | G | C |
618448 | 603847 | 213978 | 204605 |
Правило Чаргаффа не соблюдается. Рассмотрим его для пары A и T. Нулевая гипотеза - количество A и количество T незначительно различается. Среднее арифметическое равно 611147,5. Разность среднего и реального значения равно 7300,5. 2 χ = 174,4. Это больше 3,841. Значит различие в количестве A и T значительное.