Секвенирование по Сэнгеру

Первый взгляд на хромотограмму

Рассмотрены 2 файла хроматаграммы с прямой и обратной последовательностями ДНК. При просмотре обоих хроматограмм в UGENE на хорошо видны их нечитаемые концы. После выравнивания последователностей стали ясно где начинаются и заканчиваются эти концы: у прямой с 1 по 19 и с 374 по 379, с 1 по 33 и с 376 по 384 у обратной. Уровень шума "на глаз" 7-8%, в целом уровень не подниается выше 5%, но из-за 3-4 областей шума в основном в прямой последовательности я добавил еще 2-3%, если характиризовать их по отдельности, то 4% и 7% для обратной и прямой соответственно.
Хроматограмма прямой последовательности
Хроматограмма обратной последовательности
Выравнивание исходных последовательностей

Создание консенсусной последовательности

Консенсусная последовательность


31 нуклеотид и гэп между 29 и 30 несправедливо определены в N. В обратной последователности 3 четких сигнала, а прямая только начинается и содержит неточности отдаленно напоминающие обратную, поэтому оба заменены мной на А.


Программа в 77 нуклеотиде выдает N в консенсусе, но в обратной последовательности этот нуклеотид четкий, также виден протяженный шум в прямой, поэтому в итоге G.


89 нуклеотид неоправдвнно превращен в N: на прямой хромотограмме хорошо видно два четких сигнала - полиморфизм, а на обратный 3ий сигнал можно рассмотреть как шум, в итоге W.


317 нуклеотид имеет сильный сигнал в прямой последовательности, а в обратной слабоватый, но поскольку он находится в конце обратной, то его можно считать по прямой, поэтому G.

Пример нечитаемого куска


Почему хроматограмма не читабельна? Во-первых очень много протяженных скачков, которые накладываются друг на друга, во-вторых не совсем понятно где заканчивается один сигнал, а где начинается другой.