Интерпретация сиквенса

Для интерпретации результата секвенирования по Сэнгеру полученные файлы ( 41_R и 41_F) были загружены в программу Chromas, а выданные ей обработанные и обрезанные последовательности ( 41_R и 41_F) были выровнены в JalView, некомплиментарные участки за невозможностью проверки были обрезаны, а моменты, в которых в консенсусной последовательности ( скачать выравнивание) оставались неизвестными нуклеотиды, были обработаны вручную (знаки вставленных вручную нуклеотидов обозначены строчными буквами): все "N" (неопределенные нуклеотиды) были заменены на соответствующие по комплиментарной цепи.

Кроме того хроматограммы для проверки были выровнены при помощи Unipro UGENE, файл выравнивания можно найти тут. Стоит отметить, что выравнивания крайне близки, так что вполне можно пользоваться одним из них - я предпочту первый вариант.

Стоит отметить, что определенные на глаз границы читаемых отрезков совпадают с определенными программно: 49-699 позиции для обратной последовательности и 22-674 - для прямой. В целом эта часть хроматограммы довольно качественна - пики относительно четкие, неопределенных нуклеотидов менее процента, качество в среднем на глаз явно выше 20.

Полученную в JalView консенсунсную последовательность можно скачать тут.

Работа с проблемными участками

Очевидно, что не может все быть столь гладко. Консенсунсную последовательность пришлось редактировать вручную в спорных местах. На рисунке 1 представлены некоторые из них:

Рисунок 1. Сложные места

В указанных позициях сама программа не смогла определить нуклеотид на одном из прочтений, хотя при взгляде на эти места нуклеотиды определяются вполне однозначно (кроме случая Б). В случае Б же создается ощущение, что вместо одного нуклеотида ДНК-полимераза вставила два - гуанин и тимин вместо одного тимина, что, возможно, связано со случайной мутацией в данном нуклеотиде или ошибкой полимеразы на первой же стадии.

Рисунок 2. Проблемное место плохой хроматограммы

На рисунке 2 представлена одна из типичных проблем секвенирования по Сэнгеру файла WSWS2933_COI_F_A11_WSBS-Seq-1-08-15 - пятно краски, являющеееся ошибкой во время фореза и забивающее собой сигнал, что не дает правильно прочитать последовательность.