pano

Секвенирование по Сэнгеру

Задание 1

Я рассматривал хроматограммы 21_F.ab1 и 21_R.ab1. Далее я привожу некоторые их характеристики:

Прямая: 5'-нечитаемый участок: 1-23, 3'-нечитаемый: 705-717. Обратная: 5'-нечитаемый участок: 1-36, 3'-нечитаемый: 708-722. Оценка почти совпала, но программа оставила побольше нуклеотидов с 3'-концов.

Уровень шума в средней части хроматограмм прямой и обратной на глаз не превышает 10-15% от высоты пиков. Ближе к началу и концу возрастает число неоднозначных позиций, где уровень шума возрастает или присутствуют два пика сравнимой величины. Также взрастает число сливающихся пиков, где на общем основании находятся несколько пиков. В области 15-20 нуклеотидов с концов вообще не наблюдаются оформленные пики, поэтому такие участки можно признать совсем неинформативными.

Рис. 1. На хроматограмме прямой последовательности программа обрезала сильно больше букв с начала, чем на обратной. И из этого фрагмента обратной хроматограммы, на мой взгляд, тоже можно выделить последовательность c 16 позиции. В 34, 37 и 43 позициях наблюдаются полиморфизмы, выбор между T и C, но, так как нет информации с прямой последователньости, я поставил Y. В 40 позиции выбор между A и G, но тоже нет фрагмента с прямой цепи, поэтому ввиду небольшой разницы сигнала я поставил R.
Рис. 2. В позициях 110-116 хроматограммы прямой последовательности оказались два пятна красителя. Последовательность можем восстановить по обратной.
Рис. 3. В позиции 332 обратной хроматограммы уровень сигнала сопоставим с шумом, но чуть сильнее всё же синий сигнал, соответствующий цитозину. Проверяем по прямой хроматограмме и ставим C.
Рис. 4. В позиции 383 обратной хроматограммы возникла проблема автоматического определения основания, но синий сигнал, соответсвующий цитозину, заметно сильнее. Проверяем по прямой хроматограмме и ставим C.
Рис. 5. В позиции 643 обратной хроматограммы, видимо, оказалось пятно красителя. По прямой последовательности (и наличию соотвествующего пика на обратной) я выбрал T.
Рис. 6. В конце программа обрезала прямую последовательность по 744 нуклеотид, но я взял до 739, так как после него пики сливаются и достоверно определить число каждого из нуклеотидов без второй последовательности затруднительно.

Задание 2

Рис. 7. В качестве неудачной хроматограммы я взял файл WSWS2950_H3_F_G09_2013-06-11-22-39-58.ab1 из директории bad. На приведенной хроматограмме мы видим, что некоторые пики можно однозначно трактовать, а в некоторых позициях наблюдаются несколько пиков сходной высоты и таких позиций далеко не одна. Я думаю, что произошла контаминация образца и в секвенатор попали гомологичные последовательности из разных организмов, амплифицировавшиеся из-за вырожденности праймеров.