Практикум 6. Чтение последовательностей по Сэнгеру
Задание 1.
Были проанализированы два прочтения ДНК прямое и обратное ( L36_COI_F_F03_WSBS-Seq-07-10-16.ab1 и
L36_COI_R_F04_WSBS-Seq-07-10-16.ab1
L36_COI_R_F04_WSBS-Seq-07-10-16.ab1 ) полученные из капиллярного секвенатора по Сэнгеру. Каждая из хроматограмм была проанализирована сначала
на качество хроматограммы. В первом случае начало было нечитаемо, поэтому последовательность можно было начать анализировать
только с 157 нуклеотида и до 451. Во второй хроматограмме проаналировать последовательность можно было с 39 до 504.
Далее данные последовательности были исправлены, и выровнены программой JalView. Изображение выравниваниий соовпавших участков приведено ниже.
Проект выравнивания обрезанных участков: Проект в .jvp
Замечание.
Для удобства исправленные нуклеотиды выделены в группы и окрашены фиолетовым. На рисунке верхняя последовательность полученная из первого файла, хроматограммы прямого прочтения.
Нижняя последовательность из второго файла, полученная из хроматограммы обратного прочтения.
Анализируя проблемные нуклеотиды, все они однозначно определялись при сравнении одной хроматограммы с другой.
Стоит отметить что большинство не определенных нуклеотидов находилось в первой хроматограмме прямого прочтения.
Качество первой хроматограммы значительно хуже второй. Достаточно большое количество нуклеотидов в начале последовательности
проанализировать не удалось, также все спорные нуклеотиды находились в первой хроматограмме. Полиморфизмов в анализируемых участках найдено не было.
Описание некоторых проблемных нуклеотидов.
Ниже представлена часть хроматограммы двух последовательностей. Сверху-прямая, снизу-обратная с использованием функции Reverse.
Нуклеотид под номером 184 на верхней хроматограмме изначально был N, его можно было бы заменить на R, так как пики расходятся чуть меньше чем вполовину, однако на второй
хроматограмме отчетно видно, что данный нуклеотид-аденин.
Также был испрвлен нуклеотид под номером 189 в перой последовательности,
так как соответсвенный нуклеотид во второй последовательности однозначно соответсвует тимину.
Ниже представлен еще один рисунок, с частью двух хроматограмм. Был исправлен нуклеотид номер 277 в первой хроматограмме. Как видно, по первой последовательности очень сложно понять какой именно нуклеотид находится в этом положении, однако из второй хроматограммы он однознано определяется-гуанин.
Еще один проблемный нуклеотид номер 309 на первой хроматограмме. Его можно было бы изменить на W, однако из второй хроматограммы видно, что это определенно тимин.
Во второй хроматограмме был исправлен нуклеотид с номером 445.
На хроматограмме видно, что это с большей вероятностью цитозин,
однако компьютер посчитал его как N. Данное предположение подстверждается первой хроматограммой.
Ниже представлены ссылки на выравнивание пригодных участков:
Выравнивание читаемых участков
Выравнивание обрезанных участков из JalView:
Часть выравнивания
Задание 2.
Ниже представлен участок хроматограммы с нечитаемой последовательностью. Видно, что многие пики перекрываются между собой
, что не позволяет определить какой именно нуклеотид. Возможно, что в образце оказалось несколько ДНК, может даже 3 различным,
так как есть пики которые наслаиваются друг на друга.
`