Практикум 6. Секвенирование по Сэнгеру.
В ходе практикума были получены навыки чтения хроматограмм и обработки данных, полученных из капиллярного секвенатора.
Задание 1. Расшифровка результатов секвенирования.
Отчётные файлы:
Файлы с информацией о флуоресценции нуклеотидных меток - прямое (скачать) и
обратное (скачать) прочтение.
Итоговая консенсусная последовательность в fasta-формате (скачать).
Выравнивание в fasta-формате (скачать).
Для работы с хроматограммами использовалась программа GeneStudio.
В целом на протяжении большей части обеих хроматограмм шум не сильно мешает достоверному определению остатка. Исключение составляют лишь участки на концах и сложные участки небольшой протяженности. То же касается и равномерности силы сигнала и шума - на концах нельзя достоверно определить последовательность, так как пики становятся неравномерными и перекрываются шумами. Стоит отметить, что заметно отличается сила сигнала при прямом и обратном прочтении. Хроматограмма с обратным прочтением имеет более выраженные пики относительно хроматограммы с прямым прочтением.
Для начала работы с хроматограммами было необходимо обрезать 5'- и 3'-концы обеих хроматограмм, так как на концах невозможно провести
достаточно достоверное прочтение нуклеотидной последовательности.
Для прямого прочтения было удалено 52 нуклеотида с 5'-конца и 68 с 3'-конца.
Для обратного прочтения было удалено 43 нуклеотида с 5'-конца и с 85 3'-конца.
Эти обрезания оказались соответствующими автоматическому обрезанию в GeneStudio при значении параметра Automatic Medium в окне Trim Ends при импорте
файла.
Далее приведены 4 примера редактирования последовательности и формирования консенсунса на основе хроматограмм прямого и обратного прочтения. Исправления показаны буквами в нижнем регистре.
Рисунок 1. |
Рисунок 2. | Рисунок 3. |
Рисунок 4. |
Рисунок 1: пик гуанина при прямом прочтении оказался маловыраженным, так что автоматически не был определён. Наличие гуанина дополнительно
показывает обратное прочтение.
Рисунок 2: пик цитозина слился с соседним цитозином в один широкий пик. Обратное прочтение также показывает цитозин.
Рисунок 3: участок GGT, хорошо выраженный при обратном прочтении, на хроматограмме с прямым прочтением оказался трудноразличимым для программы.
Рисунок 4: заметен полиморфизм. Есть пики аденина и гуанина, поэтому этот нуклеотид был отмечен как вырожденный - R (пуриновый).
Задание 2. Нечитаемый фрагмент хроматограммы.
На рисунке 5 приведён пример нечитаемого фрагмента хроматограммы.
Рисунок 5.
Данный фрагмент был получен из вышеупомянутого вырезанного 5'-конца из хроматограммы при прямом прочтении. На фрагменте возможно различить какие-то пики, однако, принимая во внимание уровень шумов и неравномерность пиков, делаем вывод, что данный участок нечитаем. Программа не ошиблась, обозначив эти пики за N в последовательности.