|
По результатам хроматограмм из капиллярного секвенатора по Сэнгеру и последовательности, сгенерированной программой,
нужно было получить последовательность фрагмента ДНК.
Капиллярный секвенатор по Сангеру выдает файлы с хроматограммой и последовательностью в формате XXX.ab1.
Для просмотра и редактирования этих файлов я использовала программу Chromas Lite.
Я открыла файл с прямой последовательностью (файл WSWS2933_H3_F_C09_2013-06-11-22-39-58.ab1) в программе Chromas Lite,
вызвала еще раз Chromas Lite, открыла файл с обратной последовательностью (файл WSWS2933_H3_R_C10_2013-06-11-22-39-58.ab1)
и перешла к комплементарной цепочке с помощью "Reverse+Comlement". Затем я выровняла две хроматограммы с использованием
поиска подслов (Find...).
26-я координата в прямой последовательности соответствует 56-ой координате в обратной перевернутой последовательности, а 325-я — 325-ой координате в обратной перевернутой последовательности. Значит, что начало и конец чтения одной последовательности соответствует прочтенному фрагменту в другой (обратной) последовательности (рис.1).
Рис.1 Соответствие начала (слева) и конца (справа) читаемых фрагментов последовательности в прямой (сверху) и обратной (снизу) цепей. Оценка качества хроматограммы:
Для редактирования последовательности я включила опцию "Continuous edit". Затем я удалила не читаемые 5'- и 3'- концы, из-за этого изменилась нумерация нуклеотидов. Далее приведены измененные координаты нуклеотидов. Я просмотрела прямую и обратную последовательность и отредактировала их. На рис. 2 представлен фрагмент последовательности, в которой нет проблем с прочтением последовательности нуклеотидов. На рис. 3 изображены основные проблемы, с которыми я столкнулась при исправлении полученной последовательности нуклеотидов. При возникновении проблемы в определении нуклеотида я смотрела на обратную последовательность, и, если сигнал был хорошим, выбирала тот нуклеотид, который на перевернутой. На рис. 3 А в 59-й координате шум выше среднего уровня или почти как сигнал. На рис. 3 С в 245-249-ых координатах (по прямой цепи) в обратной цепи вместо двух-трех пиков — один широкий. На рис. 3 В и D в 87-й и в 108-й координатах на обеих цепях одинаковый уровень сигнала Т и С, что может говорить о том, что в этой позиции последовательности полиморфизм. На рис. 3 Е в 346-й координате пик на нетипичном расстоянии от соседей - соседние пики нетипично удалены (обратной цепи на данном фрагменте нет).
Рис.2 Фрагмент последовательности хорошего качества в прямой (сверху) и обратной (снизу) цепях.
Рис.3 Проблемы в определении нуклеотида в прямой (сверху) и обратной (снизу) цепях.
Нуклеотиды, измененные мной по сравнению с последовательностью в исходных файлах, указаны маленькими буквами в выравнивании прямой и обратной последовательности.
Выравнивание прямой и комплементарной к обратной последовательности с отмеченными измененными нуклеотидами в проекте JalView:
align.jvp.
На рис. 4 представлен пример не читаеммой хроматограммы: NN_G10.ab1. Средний сигнал практически не превосходит сигнал шума.
Рис.4 Не читаемая хроматограмма. |
© Князева Анастасия, 2015