|
|
Задание 1 Исходные файлы: Прямая цепь Обратная цепь По заданию требуется определить границы нечитаемых участков на 5' и 3' концах. Прямое прочтение: 1-26 и с 705 по последний нуклеотиды. Обратное прочтение(комплементарное прямому и реверсированное) : 1-44 и с 687 по последний нуклеотиды (в координатах обратного прочтения). Программа определяла последовательности нуклеотидов на этих участках, но я отнесла их к нечитаемым, так как пики были размыты, накладывались друг на друга, шум в некоторых местах был выше середины "настоящего" пика. На обратной последовательности можно было определить больше нуклеотидов из начала последовательности, на прямом больше из конца (рис. 1 и 2). Поэтому в координатах прямой последовательности невозможно указать координаты начального нечитаемого участка обратной последовательности, если я, конечно, правильно поняла задание. Конечный нечитаемый участок обратной последовательности начинается с 655 нуклеотида в координатах прямой последовательности. Рис.1 Рис.2 Я обрезала нечитаемые концы. Хроматограммы, в общем, хорошие: шум приблизительно в 10 раз меньше сигнала, сигнал равномерен, чаще отличается сила пиков в обратном прочтении у цитозина, в прямом у гуанина и аденина. Далее я отредактировала прямую и обратную последовательности хроматограмм вручную. Поскольку есть разница в прочтении концов, начальные и конечные последовательности я не всегда могла сверить со вторым прочтением, поэтому там оставлены "N" - обозначения спорных нуклеотидов. Используя отредактированные последовательности, я построила в программе Jalview их выравнивание . Измененные мной нуклеотиды показаны маленькими буквами. По выравниванию я сохранила "чистую" прочтенную последовательность. Ниже представлены некоторые особенные места. 1) Очень слабый сигнал. Сигнал 246 нуклеотида прямой последовательности по силе был равен шуму (на рисунке 3а виден уровень шума у 238 нуклеотида). Хотя для программы не было проблемой определение этого нуклеотида, я сочла нужным проверить его по обратной цепи. Там действительно гуанин, это показано на рисунке 3b. Рис.3а Рис.3b 2) Шум равный по силе сигналу. Сигнал 146 нуклеотида в обратном прочтении было невозможно отличить от шума - то ли на этом месте цитозин, то ли тимин. По второй цепи я определила, что цитозин. Рядом справа слабый сигнал от аденина, который программа не могла точно распознать из-за пика гуанина(шум). Рис.4а Рис.4b 3) Пятно краски. На хроматограмме обратной последовательности видно два высоких размытых пика, но похожих на сигналы от нуклеотидов. Вероятно, это пятна краски. Программа, в целом, верно определила последовательность в этих местах, нужно было только уточнить гуанин на 596 позиции. Рис.5а Рис.5b 4) Сильный шум. Та же ситуация, что и в пункте 2. Без проверки по второму прочтению непонятно, тимин на 451 позиции или цитозин. Рис.6а Рис.6b 5) Участок, на котором все очевидно. Низкий уровень шума, пики на приблизительно равных расстояниях, хорошо различимые. Рис.7а Рис.7b Задание 2 На рис.8 приведен пример нечитаемой хроматограммы (из файла kamp3_18SIII_F_F03_WSBS-Seq-1-08-15.ab1). Пики накладываются, несколько последовательностей смешаны, невозможно отличить одну от другой. Рис. 8 |