Учебная страница курса биоинформатики,
год поступления 2014
Чтение последовательностей по Сэнгеру
Результат должен быть представлен на сайте до следующего вторника (13 окт), включительно. Запись в очередь обязательна.
Прошу всех выдержать этот срок для данного задания. ААл.
1. По результатам хроматограмм из капиллярного секвенатора по Сэнгеру и последовательности, сгенерированной программой, получить последовательность фрагмента ДНК
Капиллярный секвенатор по Сангеру выдает файлы с хроматограммой и последовательностью в формате .ab1. Приписывание буквы сигналу секвенатора называется по англ. "base calling". Для просмотра и редактирования будем использовать программу Chromas (Lite).
Дано: два файла в формате .ab1, соответствующие прочтению прямой и обратной цепочки анализируемой ДНК. См. список данных, файлы лежат на диске P: в соответствующей директории ...term3/.../pr6/data
Результат должен быть представлен на странице вашего сайта. Он должен включать
- Ссылки на исходные файлы
Ссылку на выравнивание прямой и комплементарной к обратной последовательности с отмеченными измененными нуклеотидами в проекте JalView
Ссылку на файл в формате fasta с "чистой" прочтенной последовательностью. "Чистая" - значит, вы проверили каждый нуклеотид и вынесли решение о том, какой он в анализируемой ДНК. В последовательности допускаются вырожденные коды (W = A или T; N = A, T, G или C; и т.п.), если есть веские основания их употреблять.
- Протокол с описанием проблем при расшифровки последовательности и обоснованием ваших решений этих проблем. Обязательно включение не менее четырех фрагментов хроматограмм, иллюстрирующих проблемы, и одного - в котором все очевидно (итого - пять рис.). Каждый фрагмент, представленный и на прямой, и на обратной цепочке, должен быть проиллюстрирован рисунком с двумя хроматограммами - прямой и комплементарной к обратной цепочке (reverse complement). Эти хроматограммы должны быть выровнены в окрестности анализируемого нуклеотида или участка; на рис. должно быть достаточное для оценки ситуации число соседних сигналов.
Уточнение. Нуклеотиды, измененные вами (замена, вставка, делеция) по сравнению с последовательностью в исходных файлах, должны быть указаны одним из способов: * маленькими буквами в выравнивании прямой и обратной последовательности * любым другим способом в `JalView`, например, вставкой новой строки разметки под выравниванием * перечислением позиций выравнивания в отчёте
Примерный порядок действий.
- откройте файл с прямой последовательностью
- вызовите еще раз Chromos, откройте файл с обратной последовательностью и перейдите к комплементарной цепочке
- настройте масштабы по вертикали и горизонтали; по горизонтали - одинаковый масштаб для двух окошек
выровняйте две хроматограммы с использованием поиска подслов (find); повторять эту процедуру придется несколько раз - для каждого проблематичного нуклеотида или участка, т.к. выравнивание сбивается(увы, бесплатная версия не хочет выравнивать хроматограммы )
- определите и запишите в протоколе границы не читаемых 5'- и 3'-участков в каждой последовательности; координаты определяйте по прямой последовательности;
- удалите не читаемые 5'- и 3'- концы; для этого включите опцию Continuous edit
охарактеризуйте на глаз качество каждой хроматограммы:
- во сколько раз в среднем сигнал превосходит шум; (линеечка позволяет определять координаты точки по X и Y)
- равномерна ли средняя сила сигнала и шума вдоль оси X;
- во сколько раз различается сила у разных очевидных сигналов, зависит ли она от нуклеотида;
- какие еще особенности хроматограммы в целом вы заметили;
- просмотрите всю прямую последовательность и отредактируйте ее
- типичные сложные места:
- шум выше среднего уровня шума и почти как сигнал;
- пик на нетипичном расстоянии от соседей - вклинился лишний или, наоборот, соседние пики нетипично удалены
- вместо двух или более пиков - один широкий
- проверяйте сложные места по второй цепочке (если она имеется в данном месте)
- типичные сложные места:
- редактирование может состоять в
- замене буквы
- удалении лишней буквы
- вставке буквы между предложенными софтом секвенатора
- все исправления должны быть маленькими буквами!
- сделайте то же со второй последовательностью
сохраните обе последовательности в формате fasta и выровняйте их в JalView
Предостережения.
- Помните, что после "reverse comlement" конец прочтения окажется в начале перевернутой хроматограммы. Это существенно для понимания размера начальных некачественных участков.
Все выравниватели в JalView маленькие буквы превращают в большие. Чтобы сохранить маленькие буквы выровняйте последовательности в JalView вручную (Shift + мышка или Ctrl + мышка позволяют двигать посл-ть). Готовясь, я поступал так: выравнивал программой, потом исхоные последовательности выравнивал вручную, глядя на выравнивание.
На забудьте, что в JalView должна быть установлена раскраска по нуклеотидам!
2. Приведите пример не читаемой хроматограммы
- Результат - картинка на сайте и подпись с объяснением.
Файлы см. в директории bad там же на диске P: