Секвенирование по Сэнгеру
Характеристика хроматограммы
Для работы использовался UGENE
Для прямого прочтения кажущаяся нечитаемая 5'-концевая последовательность имеет длину 15 нуклеотидов (координаты 1:15). Хоть на 11, 13 и 15-ой позиции и есть прочитавшиеся нуклеотиды, пики у 11 и 15 отсутсвуют, следовательно рассматривать их не имеет смысла (Рис 1.). Кажущаяся нечитаемая 3'-концевая последовательность имеет длину 15 нуклеотидов (координаты 679:693), и хотя эта последовательность имеет кучу "прочитавшихся" нуклеотидов, пики в хроматограмме у неё отсутсвуют (Рис 2.).
![](Fig1.png) |
![](Fig2.png) |
Рис. 1: Нечитаемый 5' конец прямой проследовательности |
Рис. 2: Нечитаемый 3' конец прямой проследовательности |
Для обратного прочтения кажущаяся нечитаемая 5'-концевая последовательность имеет длину 20 нуклеотидов (координаты 1:20), хоть там и есть два прочитавшихся тимина с пиками, их качество прочтения не очень высоко (Рис 3.). Кажущаяся нечитаемая 3'-концевая последовательность имеет длину ~18 bp (координаты 680:697) (Рис. 4).
![](Fig3.png) |
![](Fig4.png) |
Рис. 3: Нечитаемый 5' конец обратной проследовательности |
Рис. 4: Нечитаемый 3' конец обратной проследовательности |
На глаз шум в хроматограмме варьируется в среднем от ~5 до ~12 %, хотя на хроматограмме есть участки, превышающие эти значения. При этом на обратной последовательности шум больше (на ~10 %).
Получение консенсусной последовательности
С помощью UGENE хроматограммы были выровнены для поиска и исправления проблемных мест в них. Примеры этих проблемных мест ниже
Примеры проблемных мест |
Обоснование |
![](Fig5.png) |
В обратной последовательности на 97 и 98 позициях есть непрочитавшиеся из-за высокого уровня шума и слабого сигнала нуклеотиды, однако в прямой последовательности на этих позициях есть хорошо прочтённые A и T, при редактировании в обратной последовательности была произведена замена. |
Рис. 5: Неизвестный динуклеотид |
![](Fig6.png) |
В то время как в обратной последовательности в пределах 116-124 позиций картина напоминает тихий ужас, в прямой последовательности нормальные пики и низкий уровень шума. Так же можно заметить два плохо разделившихся нуклеотида на позициях 123-124, из-за чего определился только нуклеотид на 124. При редактировании в обратной последовательности была произведена замена. |
Рис. 6: Кластер плохопрочтённых нуклеотидов |
![](Fig7.png) |
Из-за высокого уровня шума сначала в прямой, а затем и в обратной последовательностях есть непрочитавшиеся нуклеотиды. При редактировании в соответсвующих последовательностях была произведена замена. |
Рис. 7: Неизвестные нуклеотиды |
Плохая хроматограмма
В качестве примера плохой хроматограммы был взят образец WS2943_SP6R.ab1. Тут можно заметить множественные наслоения пиков друг на друга, кроме того, некоторые пики здесь неадекватно большого размера и странной формы. В большей части этой хроматограммы практически невозможно отделить шум от пиков в принципе. Это можно связать либо с техническим загрязнением самого секвенатора, либо с загрязнением образца сторонней ДНК. По такой хроматограмме ничего установить нельзя.
|