" Бессонница — это очень серьезно. Все вокруг кажется таким далеким, копией, снятой с копии, сделанной с еще одной копии. Бессонница встает вокруг как стена: ты не можешь ни до чего дотронуться, и ничто не может дотронуться до тебя."

Чак Паланик, Бойцовский клуб

Добро пожаловать!

Ручная оценка качества хроматограмм

Forward-прочтение

Высокий шум мешает определить первые 20 нуклеотидов в сиквенсе, а до 150 нуклеотида он сохраняется достаточно высоким, но тем не менее не мешает читать последовательность. Минимальный уровень шума наблюдается примерно с 150 по 500 нуклеотид, к 550 букве он повышается, но детектировать нуклеотиды все еще возможно, примерно после 800 нуклеотида детекция уже невозможна.

Уровень шума по отношению к уровню сигнала определялся на глаз. Уровень шума для нуклеотидов до 20 и после 800 позиций составляет более 40%, что мешает интерпретировать результаты секвенирования. Для нуклеотидов 20-150 и 500-800 он составляет от 10 до 40% от уровня сигнала. В центральной области секвенирования уровень шума не превышает 10%.

Длины и позиции нечитаемых концов были оценены вручную по позициям в выравнивании. В последовательности не детектируются нуклеотиды 21-41 и 780-951.

Reverse-прочтение

Высокий шум мешает определить первые 30 нуклеотидов в сиквенсе, а до 135 нуклеотида он сохраняется достаточно высоким, но тем не менее не мешает читать последовательность. Минимальный уровень шума наблюдается примерно с 135 по 530 нуклеотид, к 530 букве он повышается, но детектировать нуклеотиды все еще возможно, примерно после 760 нуклеотида детекция уже невозможна.

Уровень шума по отношению к уровню сигнала определялся на глаз. Уровень шума для нуклеотидов до 30 и после 760 позиций составляет более 40%, что мешает однозначно интерпретировать результаты секвенирования. Для нуклеотидов 30-135 и 530-760 он составляет от 10 до 40% от уровня сигнала. В центральной области секвенирования уровень шума не превышает 10%.

Длины и позиции нечитаемых концов были оценены вручную по позициям в выравнивании. В последовательности не детектируются нуклеотиды 0-200 и 944-951.

Решения по проблемным нуклеотидам

Сайт ФББ

В данной части сиквенса веротнее всего произошел затек краски. Нуклеотид в 84 позиции определен как С, а вот нуклеотиды в позициях 79, 80 и 82 заменены на N, так как однозначно интерпретировать результаты нельзя.

Сайт ФББ

Для данного нуклеотида (93) я полагаю полиморфизм T-G. Уровень шума на окружающих позициях достаточно низок, определить нуклеотид в данной позиции по второй цепочке невозможно, так как он не читается из-за очень высокого уровня шума. Пики почти одинаковой высоты, ровные и красивые.

Сайт ФББ

Я интерпретирую нуклеотид в 472 позиции как А, так как на второй цепочке он однозначно определяется как А.

Сайт ФББ

Я интерпретирую нуклеотид в 298 позиции как T, так как на второй цепочке он однозначно определяется как Т, а сигнал от гуанина выглядит просто как фоновый шум.

Плохая хроматограмма

Сайт ФББ

На данном изображении показан плохой участок хроматограммы. Высокий уровень шума позволяет идентифицировать лишь незначительную часть нуклеотидов (номера 843 и 876). Нуклеотиды 833 и 834 нельяз однозначно интерпретировать, так как уровень сигнала пости полностью совпадает с уровнем шума. С позиций 861 по 867 мог произойти затек краски, который не позволяет определить нуклеотиды в сиквенсе. Сигнал совпадает с шумом почти на 100% на нуклеотиде 850.

Результат обработки хроматограмм

Скачать исходные файлы и результаты практикума