Секвенирование по Сэнгеру

Задание 1. Анализ последовательностей Сэнгера

Консенсусная последовательность

Выравнивание двух последовательностей

Прямая последовательность

Обратная последовательность

Для выполнения задания в программу UGENE были загружены прямая и обратная последовательность. Программа сама их выровнила. Все полученные файлы можно скачать по ссылкам вверху. Начало нормально читаемого участка для прямой и обратной последовательности у меня и у программы совпало: с 25 нуклеотида и с 33 соответственно. Тогда как нечитаемых нуклеотидов конечных участков я насчитала для каждой последовательности на 10 больше, чем у программы ( с 685 и 702 нуклеоида соответственно). Уровень шума в обратной последовательности намного ниже, чем в прямой, у которой сигнал превышает шум в 3-4 раза в среднем. Также в прямой последовательности шум распределен очень неравномерно, тогда как в обратной он остается постоянно низким. И в целом можно сказать, что хроматограмма обратной последовательности намного более ясная и в ней меньше проблемных нуклеотидов (в прямой последовательности такой нуклеотид в среднем встречается каждые 80 нуклеотидов). Ниже, на рисунках можно увидеть примеры таких случаев.

Проблемный нуклеотид 1
Рисунок 1. В прямой последовательности виден четкий, хоть и слабый сигнал гуанина, так что здесь с большой уверенностью можно ставить гуанин, тем более высокий сигнал в обратной последовательности это подтверждает.
Проблемный нуклеотид 2
Рисунок 2. В данном случае в прямой последовательности сигнал гуанина ненамного ниже сигнала аденина, поэтому программа и не идентифицировало это как аденин. Но в обратной последовательности это четкий сигнал аденина, поэтому мы делаем вывод, что в прямой сигнал гуанина - это шум.
Проблемный нуклеотид 3
Рисунок 3. Похожая ситуация у 419 и 424 нуклеотида. На прямой последовательности видно два сигнала, которые схожи по интенсивности и с уверенностью сказать, какой из данных сигналов - шум, а какой - нет нельзя. Поэтому смотрим на обратную последовательность, у которой на 419 сильный, не загрязненный шумом, сигнал аденина, а на 424 - гуанина.
Проблемный нуклеотид 4
Рисунок 4. Случай немного отличается от трех предыдущих, так как на обратной последовательности между 52 и 54 нуклеотидами пропущен еще один. Это видно и по расстоянию между пиками (оно очень широкое для двух стоящих рядом нуклеотидах) и по верхней хроматограмме. Скорее всего просто ни в одной из реакций на это место не вставился нуклеотид без -OH группы (хотя вероятность этого очень мала).

Задание 2. Анализ нечитаемого фрагмента хроматограммы

Фрагмент нечитаемой хроматограммы
Рисунок 5. В качестве примера плохой хроматограммы был взят один из файлов в папке bad. На данном участке длиной 30 нуклеотидов сигналы очень слабые, они перекрываются с шумом, и получается, что пики примерно одной высоты наслаиваются друг на друга. Видны два высоких пика, что похоже на следы краски. И хотя программа некоторые участки ставит в соответствие с нуклеотидами, мне кажется, что тут невозможно достоверно определить "правильный" пик.