Для получения консенсусной последовательности было проведено выравние с помощью BLAST. Наибольше колиество проблемных участвков содержала F-последовательность
Ссылка на консенсусную последовательность: 39-F
Ссылка на выравниевание: Alignment39F-R
Из двух файлов были взяты хроматограммы прямой и обратной цепей. С помощью программы Chromas они были визуализированы, последовательность была определена автоматически. Также программа определила концевые нечитаемые участки хроматограммы
Нечитаемые участки 5'-концов практически одинаковы в обеих хроматограммах, однако размеры нечитаемых участков 3'-концов существенно различаются
Прямая цепь:
5'-конец: 55 нуклеотидов
3'-конец: 81 нуклеотид
Обратная цепь:
5'-конец: 56 нуклеотидов
3'-конец: 181 нуклеотид
В целом, качество (по количеству неопределённых нуклеотидов в читаемых участках) обратной хроматограммы лучше, чем прямой, поэтому большинство нуклеотидов восстанавливались по обратной цепи
Таким образом, если для обратной процент шума практически нулевой на большей части длины, то для прямой на лучших участках он составляет порядка 5-15%, а, начиная с середины уже превышает 40%
Пример полиморфизма (339 позиция):
Определение N в прямой последовательности по обратной (позиция 175; рис.3)
На рис.3 показан участок хроматограммы прямой последовательности. На рис.2 - обратная (комплементарная, не перевёрнута)
R: A C T A A A A A A A A A A | | | | | | | | | | | | | F: T N A T T T Т Т Т Т Т Т Т
Из хроматограммы можно сделать вывод, что на месте N должен быть либо G, либо A (так как уровни почти одинаковые). Очевидно, нам подходит G. Получаем:
R: A C T A A A A A A A A A A | | | | | | | | | | | | | F: T g A T T T Т Т Т Т Т Т Т
В результате получили консенсусную последовательность:
GCTTTTGTTATAATTTTTTTTTTAgTTATACCTGTTTTAATTGGAgGATTTGGTAATTGA TTATtACCTTTAAtATTAgGGGctCCCGAtAtAGCTTTCCCCCgAAnAAAtAAcAtAAnT TTTTGGTTATTACCACCTTCTTTAaCTCTTCTGTTAAAAAnTtcTTTAGtGgAAATAGGG GCAGGAACGGGGtGAACAntAnACCCtCCaCtAtCTAGtAATTTAnCCCATTCAGGAGGG tCtGtagATTTAgCtATTTTTTCATTACaTTTAgCtGGGGTTtCTTCtATTTTAGGGGCT ATTAATTTTATTACTACtACAATTAAtATGCGGtGAtAtGGATATCAATTTGAAcATATC CCATTATTTGtGtGGtCtGTAAAATTAACAGCTATTTTATTATTGCTATCtCTACCTGTT TtAgCTGGGGCTATTACAAtATtATTAACAgATCGTAATTTTAAtACGTCATTTTTTGAT
Пример плохой хроматограммы (рис.4 ;шумы в самом начале):