Практикум 6

Задание 1.

forward reverse

Консенсусная последовательность

fasta-файл с консенсусной последовательностью

Прямая и обратная последовательность

выравание

Проблемные нуклеотиды

image
1. Неточность прочтения(сигнал сильно выбивается из общего фона, пиков сразу много) одной из хроматограмм удалось устранить при помощи сравнения со второй, пики в этом месте четко отделяются друг от друга. Наверное это ошибка работы техники при электрофорезе.

image
2. Один широкий пик удалось разделить при помощи сравниения со второй последовательностью. Думаю, такая "сложность" - тоже ошибка фореза.

image
3. В обоих последовательностях был замечен полиморфизм Т/С - пики обоих цветов очень похожего уровня.

image
4. Здесь видно, что во-первых появляются лишние пики G (черные). В итоге я решила, что буду считать это шумом - они невысокие и уж очень выбиваются из общей периодичности, даже по сравнению с соседними. Во-вторых, тут видно 2 отмеченных полиморфизма С/Т.


Общая характеристика хроматограммы

Длины обрезанных участков, у меня и у программы вышли примерно одинаковыми. Интересно, что качество хроматограмм в 2х моих файлах сильно отличались. F - хроматограмма обладала более слабым в целом, судя по всему, сигналом: общая высота пиков была меньше (но тут не понятно, так как я не знаю, как инерфейс прогарммы устроен и как он вычисляет высоту пиков!). На картинке 1 выше заметно единичное выбивание при считывании - то есть шумов мало, и они распределены неравномерно по хроматограмме. Такие же сильные выбивания заметны в на 3'конце. R-хроматограмма обладала гораздо большим уровнем шума, равномерно распределенного по последовательности - пости всегда были побочные низкие пики.

Таблица 1. Длины нечитаемых участков
Цепочка начальный концевой
Прямая 12 364 - 381
Обратная 25 362 - 379

Задание 2. Нечитаемая хроматограмма

image
Я посмотрела на хроматограмму из файла '/public/y18/term3/block2/ab1_files/bad/kamp3_18SIII_R_F04_WSBS-Seq-1-08-15.ab1'
Думаю, что такая картина связана с тем, что в препарате было 2 днк - можно вычленить примерно по два пика одинаковой высоты в каждой позиции. Хотя и отдельные позиции здесь дифференциировать сложно.