Чтение последовательностей по Сэнгеру

I

Были обработаны две хроматограммы, являющиеся результатами секвенирования по Сэнгеру: прямая и обратная последовательности. На хроматограмме с прямой последовательностью на 5'-конце нечитаемым оказался первый 21 нуклеотид (1:21), на 3'-конце же нечитаемы последние три нуклеотида (376:378); в случае с обратной последовательностью на 5'-конце невозможно определить 35 нуклеотидов, на 3'-конце же все читаемы. Важно заметить, что некоторые участки нечитаемы в одной последовательности, но при этом вполне приемлемо определяются в другой. Таким образом, объединяя результаты для двух цепей, можно получить наиболее подробное и точное определение нуклеотидной последовательности.

В целом хроматограммы хорошие. На 5'-концах качество хроматограмм заметно уменьшается, однако их можно восстановить из-за наличия обратных цепей. Стоит отметить, что Chromas выделил как «плохие» участки намного больше, чем удалил я (видимо, у него стоит автоматический контроль качества). Однако в целом пики на них хоть и низкие, но порой достаточно чёткие, поэтому этими участками можно пользоваться как минимум для верификации идентичных «хороших» участков в обратной хроматограмме. В целом уровень шума меньше уровня сигнала в 9-10 раз. Далее было необходимо проанализировать последовательности и отредактировать их, сравнивая результаты двух хроматограмм и исправляя потенциально возможные ошибки программы. Все исправления внесены строчными буквами.

Результаты работы: .fasta-последовательность ДНК, JalView-проект, исправленная хроматограмма прямой последовательности, исправленная хроматограмма обратной последовательности. Описание некоторых проблем, с которыми я столкнулся при выполнении задания:

  1. Первый случай. На хроматограмме оказалось пятно краски (хроматограмма сверху), которое не дало понять, что именно за нуклеотиды в последовательности. Восстановить последовательность помогла хорошая по качеству другая хроматограмма.
  2. Второй случай. На хроматограмме с прямой цепочкой (сверху) можно было предположить полиморфизм, однако нечёткие пики А по соседству ставили этот полиморфизм под сомнение. Вторая хроматограмма дала уверенность в том, что это правда полиморфизм.
  3. Третий случай. В окружении С слева и двух С справа на месте G возник ещё один пик С (правда, меньшей силы). Хроматограмма обратной цепочки дала понять, что на самом деле там должен быть просто пик G.
  4. Четвёртый случай. На хроматограмме сверху из-за соседства трёх А получился один размытый пик; хроматограмма с обратной цепочкой расставила всё на свои места и показала, что там именно три А, а не два или четыре.

II

Пример плохой хроматограммы — здесь уровень шума очень высок, практически в каждой позиции присутствует сразу несколько пиков. Это может говорить о том, что при секвенировании в образце было несколько различных последовательностей ДНК. Также здесь присутствуют пятна краски.