Секвенирование по Сэнгеру
Файлы с прямой и обратной последовательностями можно посмотреть, пройдя по 13_F.ab1 и 13_R.ab1 ссылкам.
Выравнивание прямой, обратной последовательностей, а также референса (то есть того, что было получили после сборки, но до корректировки ошибок)
в contig_sanger_reads_alignment_4.fasta файле.
Ссылка на файл с результатом — консенсусной последовательностью в формате fasta,
и файл с исправленной прямой, обратной последовательностью и референсой.
Нечитаемые участки в начали и конце последовательности:
Обоснование решений проблемных нуклеотидов и полиморфизмов.
На первом рисунке с помощью хроматограммы с прямой последовательности можно различить A512 и A516.
В этом примере плохо показана информация через обратную последовательность, но хорошо все видно через прямую. На прямой последовательности видны пики T628, A629 и A630. Так же можно различить пики G632 и G633.
По прямой последовательности сложно понять G или T. По обратной последовательности становиться ясно, что хорошо выражен пик T, поэтому выбираем Тимин.
Первый неопределенный четко нуклеотид определен, как аденин(N заменяем на A). Вместо второго неопределенного нуклеотида ставим gap("-"). На месте третьего и четвертого полиморфизм Y(C или T).
Характеристика хроматограммы
Хроматограммы по качеству хорошие. Есть несколько пятен краски из-за ошибок в форезе(например на интервале 624-634 в обратной последовательности). Ошибки происходят из-за повышения шумов. И было несколько полиморфизмов.
Примеры нечитаемого фрагмента хроматограммы
Была взята хроматограмма из файла L43_COI_F_C05_WSBS-Seq-07-10-16.ab1.
По хроматограмме можно сделать вывод, что произошла ошибка во время фореза, то есть пятно краски испортило хроматограмму.
Также расстояние между всеми пиками разное. На хроматографии видно множество вторых пиков, что может говорить о делеции.