Практикум 6. Секвенирование по Сэнгеру

Получение последовательности из .ab1, отчет по анализу хроматограммы

Материалы и резульаты

Рассмотрены хроматограммы из файлов 27_F.ab1 и 27_R.ab1. Конвертация из .ab1 в .fasta осуществлена с помощью веб-сервиса. Выравнивание выполнено NCBI BLASTn. Результаты конвертации и выравнивания представлены по ссылкам: файл с 27_F.fasta, файл с 27_R.fasta, файл с выравниванием. Итоговую консенсусную последовательность, построенную с помощью Pearl, можно просмотреть по ссылке.

Анализ хроматограммы

В целом хроматограмма однозначна и понятна, области трудного чтения находятся по краям. Для прямой цепи нечитаемые участки до 44 и после 703, для обратной - до 44 и после 703, все включительно. Позиции для обеих цепей совпали, длины участков - 44 и 17 нуклеотидов для прямой и 44, 19 для обратной. Подсчеты велись с помощью поиска в Far и команды 'wc -c'. Замечено, что преобразование .ab1 в .fasta несколько иначе определила некоторые нуклеотиды, в основном или добавились неизвестные (N), или некоторые были отмечены как неизвестные. Если рассматривать шумы как любые побочные отклонения кривых от нуля, то они встречаются часто - на глаз примерно в каждом втором-третьем пике. Но высота шума невелика и на глаз составляет около 1/8 средней высоты пика (использовалась опция увеличенных пиков в Pearl), распределение шумов показывает, что они сконцентрироавны по краям последовательностей. При этом для обратной цепи количество и высота пиков на глаз ниже, чем у прямой.

Всего были найдены пять "сложных" участков, они представлены на изображениях ниже.

Лишний пик аденина между 623-624а
Рисунок 1. Лишний пик аденина между 623-624
Участок концентрации аденина, возможно проскальзывание полимеразы<
Рисунок 2. Участок концентрации аденина, возможно проскальзывание полимеразы
Пологое объединение соседних пиков 138-140 + небольшие шумы
Рисунок 3. Пологое объединение соседних пиков 138-140 + небольшие шумы
Рисунок 4. Крупный шум лишнего цитозина в районе 36 нуклеотида
Рисунок 4. Крупный шум лишнего цитозина в районе 36 нуклеотида

1. Между 623 и 624 нуклеотидами замечен пик аденина. Его высота сравнима с таковой у действительных нуклеотидов, но допуская, что между пиками примерно одинаковое расстояние, его расположение подвергается сомнению. Просмотр копмлементарной цепи показал остутствие в этом месте аденина, в связи с чем он не был добавлен в консенсусную последовательность.

2. С 533 до 538 идут шесть аденинов подряд + имеется около пяти отделенных единичным основанием. Это участок однообразного состава, наличие которых может сопровождаться проскальзыванием полимеразы. Но несоответствий в окрестности области найдено не было.

3. 138-140 гуаниновые нулеотиды имеют менее различимые пики. Просмотр комлементарной цепи и примерная оценка расстояния между соседними пиками подтверждают наличие трех гуаниновых нуклеотидов подряд. К тому же, исключается влияние небольших шумов комплементарной цепи при просмотре данной.

4. В районе 36 нуклеотида обратной цепи замечен крупный пик цитозина, но на другой цепи его нет. В этом месте, вероятно, находится тимин, поэтому он добавляется в консесусную последовательность.

Вторичная структура PR0163 построенная алгоритмом Зукера
Рисунок 5. Участок "трудного" чтения из 27_R

5. На отдельном рисунке предствлен участок "трудного" чтения обратной цепи, на нем видны плохо оформленные пики и высокие шумы. Например, для 17 и 29 нуклеотидов расположение кривых почти идентично, но в случае 17 выбрана верхняя, а в случае 29 - нижняя. Веротно, из-за крутизны роста - цитозин в 29 позиции растет слишком быстро, чтобы предположить его наличие. Из-за отсутствия сравнения обе позиции были подмечены как нечитаемые (только в косенсусной последовательности, изображение получено до редактирования).

Анализ нечитаемого фрагмента хроматогораммы

Использовалась хроматограммы из файлов: прямая цепь, обратная. Один из участков представлен на рисунке ниже.

Вторичная структура PR0163 построенная алгоритмом Зукера
Рисунок 7. Участок "трудного" чтения проблемных хроматограмм

Частота и амплитуда шумов в этих хроматограммах выше. В частности, в позициях 12-13 (36-37) Pearl затрудняется в выборе нуклеотида из-за преобладания разных нуклеотидах в разных хроматограммах. Вероятно, адениновый высокий шум является лишним из-за ошибок при ПЦР, так как тимин отображен в обеих цепях. Нуклеотид в 7 (31) позиции, скорее всего, - цитозин, потому что кривая тимина просто заслонила кривую цитозина. Высокая интенсивность флуоресценции и плато появляются в этом месте по невыясненной причине (пятно красителя?). Содержание 15 (39) нуклеотида тоже не до коца ясно. Даже если предположить ошибочность адениновых пиков на верхней хроматограмме, соседний 14 (38) нуклеотид с высокой степенью уверенности - адениновый, а расположение кривых в самой рассматриваемой позиции неоднозначно.