Чтение последовательностей по Сэнгеру.
Редактирование хроматограмм.
С помощью бесплатной версии программы Chromas были изучены две хроматограммы - прямая и обратная последовательности.
Чтобы изучить последовательность, прямую последовательность Ae2_18SII_F_E05_WSBS-Seq-1-08-15.ab1 сравнили с Ae2_18SII_R_E06_WSBS-Seq-1-08-15.ab1,
предварительно получив из последнего файла комплементарную обратную последовательност опцией Reverse.
Редактирование производилось следующим образом:
- Были обрезаны плохо-читаемые концы - программа автоматически выделяет нуклеотиды,
которые плохо поддавались анализу (по прямой последовательности: до 55 нуклеотида в начале
и от 612 нуклеотида в конце. Вполне разумные для анализа значения.
Однако в реверсивной последовательность и шумы гораздо выше, и начало хроматограммы
гораздо дольше остаётся нечитаемым - программа выделяет отрезок до 214 (212 по прямой последовательности) с начала - мы же для анализа не можем себе
позволить точность программы, и должны отодвинуть начало хотя бы до до 240 (238 по прямой последовательности) нуклеотида.
Конец реверсивной последовательности программа опредеяет, начиная с 910 нуклеотида - очевидно, это уже гораздо дальше,
нежели уже вышеозначенный нами конец прямой последовательности.
- Далее просматривалось пересечение последовательностей с 212 нуклеотида до 612 по прямой последовательности.
- Были отмечены типичные сложные места: сдвоенные пики, некоторые буквы были земенены, некоторые удалены, некоторые вставлены.
Все исправления легко отследить - все они в документе сделаны маленькими буквами.
- Исправения были сделаны на основании второй цепочки.
Качество хроматограммы на глаз можно охарактеризовать как удовлетворительное, шум не мешал анализу на выбранном участке, и его усреднённый уровень на обоих хроматограммах примерно одинаков -
в том смысле, что в отдельных местах, например в начале, или в конце, он может разниться, в реверсивной и прямой последовательностях,
но в целом эти отличия нивелируются. В конце прямой и в начале обратной(естественно) шума больше, чем обычно. Сдвоенных пиков набюдалось не много, но они присутствовали, 1-2 на двести нуклеотидов примерно.
Хотелось бы отметить, что в прямой последовательности "рабочей" является часть, которая составляет 557 нуклеотидов, когда как в обратной - 670 нуклеотидов,
то есть при желании обратная последовательность даёт нам больше информации.
И вот что по итогам получилось:
Рисунок 1. Сравнение и редактирование хроматограмм.
Две последовательноти были выровнены и представлены вам на суд.
На этом конкретном участке мы видим ошибки в пяти местах, все они связаны с неадекватным прочтением прибора - вместо каждого из строчных нуклеотидов стоял N - то есть хроматограмма в этом месте не была опознана.
Это начало прямой последовательности(верхняя хроматограмма),
так что на ней гораздо чётче видны пики, в то время как у реверсивной последовательности они более размыты.
- Ошибка в реверсивной хроматограмме - нечёткий пик. Сверяемся с прямой - пик чёткий, значит это нуклеотид А.
- В реверсивной хроматограмме - вновь нечёткий пик, сдвоенный. вновь обращаемся к первой прямой хроматограмме - нуклеотид G
- Та же схема в ошибке с нуклеотидом С - там вообще нет пика, пришлось добавить этот нуклеотид искусственно.
- Наконец, ошибка в прямом прочтении - не распознан нуклеотид А из-за уровня шума, близкого к прочтению. Но пик А выше, к тому же на реверсивной хроматограмме сдвоенный ик АА весьма чёткий.
- Вновь ошибка в прямом прочтении, и вновь из-за уровня шума. К счастью, на обратной хроматограмме этот пик прекрасно виден!
Ознакомиться с проектом или fasta-последовательностями можно ниже:
Проект в JalView(html)
Проект в JalView(файл jvp)
Fasta-файл выравнивания
Исходный файл прямой последовательности.
Исходный файл обратной последовательности.
Пример нечитаемой хроматограммы
На рисунке ниже приведён фрагмент конца прямой последовательности. Собственно, случаи снижения качества к концу хроматограммф считаются, скорее, типичными.
Конкретно в этом случае мы видим появление вторых пиков, но на данной хроматограмме
это всего лишь повсмеместный шум. Что более интересно - из-за потери качества мы видим сдвоенные пики.
Подобный феномен может быть связан с тем, что полимераза начинает сваливаться, прекращая синтез, и разница в длине между соседними фрагментами становится более очевидна. Так как полимераза на этом участке будет сваливаться гораздо чаще, чем на предыдущем массиве. Разницы в несколько нуклеотидов накапливаются и отражаются на хроматограмме.
Близкие полосы на форезе и образуют неразошедшиеся пики.
Рисунок 2. Нечитаемый конец
Вернуться назад
На главную страницу
©Solonovich Vera,2017