Анализ крупных перестроек геномов
1. Выбор трёх геномов бактерий.
Для выполнения данного практикума были выбраны геномы бактерий:
1. Helicobacter pylori 26695 , AE000511.1
2. Helicobacter pylori 51 , CP000012.1
3. Helicobacter pylori 2018 , CP002572.1
2. Вычисление сходства (identity %) на гомологичных участках геномов и покрытие геномов гомологичными участками (процент
гомологичных участков от длины геномов):
Данные о сходстве геномов приведенных бактерий были получены с помощью программы
NPG-explorer.
Пример выдачи программы.
Identity среди s-блоков (стабильных блоков, содержащих по одному фрагменту из
каждого генома) варьируется в пределах от 80,1% до 98,5%. Для h-блоков ("полустабильных"
блоков - по одному фрагменту из 2х геномов) identity лежит в пределах от 82,6% до 100%.
У u-блоков (уникальных последовательностей 1го генома) identity=100% (что закономерно).
Значения покрытий геномов гомологичными участками были взяты из выдачи программы
blast2seq (Query cover):
- Helicobacter pylori 26695 vs. Helicobacter pylori 51 - 90%
- Helicobacter pylori 26695 vs. Helicobacter pylori 2018 - 90%
- Helicobacter pylori 51 vs. Helicobacter pylori 2018 - 91%
3. Исследование крупных перестроек.
Карты локального сходства геномов:
Fig. 1 H. pylori 26695 vs. H. pylori 51
Fig. 2 H. pylori 26695 vs. H. pylori 2018
Fig. 3 H. pylori 51 vs. H. pylori 2018
Крупные перестройки:
- Крупные делеции и вставки
- делеции: с большой вероятностью h2-блоки будут являться делециями, т.к. данный
фрагмент встретился в двух геномах и отсутствует в третьем. Так, например, блок h2x1158
содержит 6 генов и присутствует в геномах H. pylori 51 и H. pylori 2018, но отсутствует у H. pylori 26695.
Значит, возможно, в геноме последней бактерии произошла делеция.
- вставки: последовательность u1x481 содержит 1 ген и встречается только в геноме
H. pylori 51, поэтому, скорее всего, она является результатом вставки.
- Участки, повторяющиеся в одном геноме
- блок r4x320 содержит 5 генов и встречается во всех геномах, причём в геноме
H. pylori 51 - дважды, т.е. данный фрагмент повторился.
- Инверсии
- Fig. 1: на участке 520К - 940К можно наблюдать крупную инверсию, а на участках 380К - 440К
и 1,040М - 1,160М видны инверсия и транслокация одновременно.
- Cинтеничные участки
- Самый длинный синтеничный участок для данных геномов - g3x197771, состоящий из 406
блоков.
© Svetlana Kozyulina 2017