Чтение последовательностей по Сэнгеру

Вернуться на страницу семестра

Прочтение последовательности ДНК на основании данных, полученных из капиллярного секвенатора по Сэнгеру

Капиллярный секвенатор выдает файлы с хроматограммой и автоматически прочтённой последовательностью в формате .ab1. Дано два файла в формате .ab1, соответствующие прочтению прямой и обратной цепочки секвенируемой ДНК. Для просмотра хроматограмм и редактирования автоматического прочтения используется программа Chromas (Lite).

Таблица 1. Границы нечитаемых 5'- и 3'-участков в каждой последовательности (обратная в режиме Reverse)

Последовательность 5' 3'
Прямая 1-16 -
Обратная - 342-356

Проблемный нуклеотид — тот, по которому вы приняли решение, отличное от предложенного программой, или вы согласились с программой, но необходимо было проанализировать хроматограммы и принять решение. Проблемные нуклеотиды в последовательности выделены в проекте выравнивания строчными буквами.
Полиморфизм — нуклеотид, про который вы решили, что в секвенируемой ДНК встречаются два (или более) варианта.
Если говорить в общем о хромотограмме и её качестве, то шумов довольно мало, только в нескольких местах удалось предположить полиморфизм, и всего в 2 местах обратной последовательности были пятна краски. Поэтому я бы сказала, что хроматограмма вышла удачной, легко читаемой, исправлений потребовалось немного. Исправляем риды в обеих последовательностях, сверяя с другой.

Таблица 2. Примеры проблемных нуклеотидов или полиморфизмов в последовательности (прямая - вверху, обратная - внизу)

Нуклеотид 325 в обратной последовательности не был определен, хотя пик довольно явный. На прямой он определен однозначно, и это гуанин.
Нуклеотиды 262, 263 в обратной последовательности не были определены из-за шумов. На прямой это цитозин и тимин соответственно.
Нуклеотид 80 в прямой последовательности проблемный, потому что появляется довольно сильный, сопоставимый шум. На обратной вывод программы подтверждается - это аденин.
На прямой последовательности за нечитаемым концом идет участком, где много слитых в основании пиков - начиная с 27 позиции. По обратной цепи мы определяем 27 позицию - гуанин, а также подтверждаем выдачу программы.
На прямой последовательности в позиции 353 пики почти на одинаковой высоте. Возможно, это полиморфизм C or T (Y). Но предположение сложно проверить, так как на обратной цепи этот нуклеотид в нечитаемой зоне

С помощью программы needle я сделала выравнивание двух последовательностей - исправленные мною последовательности хроматограммы (все исправления маленькими буквами). Fasta-файлы с ридом прямой цепи и обратной. С помощью Jalview получила визуализированное выравнивание, приведённое ниже.

Выравнивание в Jalview


Ссылка на проект выравнивания
Итоговая консенсусная последовательность в fasta

Пример нечитаемого фрагмента хроматограммы

На рисунке 1 мы можем увидеть пример небольшого нечитаемого участка в середине секвенирования обратной последовательности, которое рассматривали ранее. Это так называемое пятно краски. Но в данном случае, нам повезло, потому что исходную последовательность легко восстановить по прямой.

Рисунок 1. Нечитаемый фрагмент






© Миронова Екатерина 2017 год