Секвенирование по Сэнгеру

Мои последовательности: 43_F и 43_R.
Делала всё в UGENE - он показался удобнее и приятнее.

Общая характеристика хроматограммы

Координаты нечитаемых концов:
Forward: 5'-[33;53] (21 база);
Reverse: 5'-[367;384] (18 баз).
Отношение сигнала к шуму в среднем достаточно большое, для того чтобы беспрепятственно определять нуклеотиды.

Проблемы

1. F, 28 позиция: видно, что пик для А выше более чем в два раза. Поменяла на А, тем более, в реверсе тоже А.

участок хроматограммы
Рис. 1. Первый пример редактирования нуклеотида.

2. F, 112 позиция: одинаковая высота у пиков Т и С, следовательно, имеем дело с SNP "Y".

участок хроматограммы
Рис. 2. Пример наличия SNP.

3. R, 79-83 позиции: видим так называемое "пятно краски", поменяла на N, потому что у форварда эти нуклеотиды с довольно низким качеством. По-моему, подходящий кандидат для нечитаемого фрагмента (задание 2). Интересно, что там, где зашкаливает след от С, всё равно программа выбирает Т, потому что для него есть пусть низкие, но пики нормальной формы.

участок хроматограммы
Рис. 3. Пример "пятна краски".

4. R, 380 позиция: возможно, ещё SNP - "M".

участок хроматограммы
Рис. 4. Ещё SNP.

Итоги

Убрала нечитаемые концы в выравнивании, где ещё не было исправлений, и решила, что так неудобно считать, поэтому вернула, но из консенсуса снова убрала.
Для получения консенсусной последовательности в формате .fa я загрузила в UGENE по отдельности исправленные F и R последовательности (.fa), после чего сделала их множественное выравнивание с типом консенсуса "Simple extended".
Выравнивание; Консенсусная последовательность.