Чтение последовательностей по Сэнгеру

Задание 1.

Ссылки на исходные файлы в .ab1 формате: WSLOX1_COI_F_B01_WSBS-Seq-1-08-15.ab1 и WSLOX1_COI_R_B02_WSBS-Seq-1-08-15.ab1.

В данном задании необходимо проанализировать хроматограммы прямой и обратной выданных цепей и составить отчет, в котором следует указать на проблемы, возникающие при чтении хроматограммы. Для просмотра хроматограмм использовалась программа Chromos Lite. С помощью Continuous edit удаляем не читаемые 5'- и 3'- концы.

Таблица 1. Характеристика хроматограмм (в целом)

Параметр Прямая цепь Обратная цепь
Оценка (на глаз) отношения сигнала и шума в среднем В среднем, оценка колеблется между отношением 1:6 и 1:8 (шум:сигнал). В среднем, оценка колеблется между отношением 1:8 и 1:20.
Неравномерность силы сигнала и шума вдоль последовательности Довольно не равномерно: есть участки, где мы точно можем различить сигнал/шум, а сеть участки, где сигнал/шум практически одной высоты. В большинстве случаев, сила сигнала превышает силу шума. Распределение примерно равномерное.
Длина начального нечитаемого участка 55 181
Длина конечного нечитаемого участка 81 56
Особенности Границы не читаемых 5'- и 3'-участков: с начала до 55 (5'), с 636 до конца (716) (3'). Границы не читаемых 5'- и 3'-участков (координаты по прямой последовательности): c начала по 150 (5'), с 632 до конца (687) (3').

Рис.1 - Выравнивание 2 хроматограмм (прямая цепь - верхнее окно; цепь, комплементарная обратной - нижнее)

2 последовательности в формате fasta были выровнены в JalView: ссылка на проект JalView. Проблемные нуклеотиды и полиморфизмы были выделены строчными буквами. 1-ая последовательность - прямая, 2-ая - обратная. Последовательности в fasta формате с выделенными строчными буквами проблемными нуклеотидами и полиморфизмами (ссылки для просмотра): прямая цепь; цепь, комплементарная обратной.
Был получен файл с объединенной из прямой и комплементарной обратной цепей последовательностей: ссылка .

Таблица 2. "Решение" для 4 проблемных нуклеотидов (верхний ряд - прямая цепь)

Проблемный нуклеотид - 120. Сигнал почти совпадает по вышине с шумом. Решение было принято с помощью обратной цепи.

Проблемные нуклеотиды: 284 ( 2 сравнимых сигнала) и 288 (сигнал приближен по высоте к шуму). С помощью обратной последовательности было решение согласиться с программой в 1 случае, и поставить "t" во втором.

Проблемный нуклеотид - 174. Сигнал почти совпадает по вышине с шумом. Решение было принято с помощью обратной цепи.

Задание 2.

Из директории bad на диске P была взята "плохая" хроматограмма для приведения примера не читаемого фрагмента. Фрагмент был взят из файла: NN_G10.ab1. Ссылка на файл формата ab1.

Как мы можем заметить, сила сигнала и шум по высоте практически сопоставимы; пики в центре картинки имеют по несколько вершин, они довольно широкие и "налезают" друг на друга. Расстояние между остальными пиками (точнее, их вершинами) не постоянно, некоторые пики накладываются друг на друга таким образом, что практически совпадают.

Рис.2 - Пример не читаемого фрагмента


© Kalashnikova Anastasia, 2016