Учебная страница курса биоинформатики,
год поступления 2015
Чтение последовательностей по Сэнгеру
1. Прочитать последовательность ДНК на основании данных, полученных из капиллярного секвенатора по Сэнгеру. Составить отчёт о проблемах при чтении хроматограмм
Пояснения.
Капиллярный секвенатор по Сангеру выдает файлы с хроматограммой и автоматически прочтенной последовательностью в формате .ab1.
Вам дано два файла в формате .ab1, соответствующие прочтению прямой и обратной цепочки секвенируемой ДНК. См. список данных, файлы лежат на диске P: в соответствующей директории ...term3/.../pr6/data
Для просмотра хромаьтограмм и редактирования автоматического прочтнения будем использовать программу Chromas (Lite).
Отчет должен быть представлен на странице вашего сайта.
Термины
Проблемный нуклеотид - тот, по которому вы приняли решение, отличное от предложенного программой, или вы согласились с программой, но необходимо было проанализировать хроматограммы и принять решение.
Проблемные нуклеотиды в последовательности выделяйте строчными буквами.
Полиморфизм - нуклеотид, про который вы решили, что в секвенируемой ДНК встречаются два (или более) варианта.
Полиморфизмы обозначайте кодами вырожденных нуклеотидов (ambiguity codes) - W: A или T; S: G или C; и т.п.
Что должно быть в отчёте.
- Ссылка на файл с результатом - последовательностью в fasta формате с выделенными строчными буквами проблемными нуклеотидами и полиморфизмами.
Jalview проект с выравниваним прочтений прямой и обратной последовательности - тех частей, которые вы признали пригодными; выделите проблемные нуклеотиды и полиморфизмы.
- Обоснование ваших решений для четырех проблемных нуклеотидов или полиморфизмов:
- картинка с выровненными хроматограммами окрестности проблемного нуклеотида, достаточной для оценки ситуации (три - четыре с каждой стороны)
- ваше решение и обоснование
- Характеристику хроматограммы в целом:
- длины начального и конечного нечитаемых участков (для обратной - после замены на комплементарную!)
- оценку (на глаз) отношения сигнала и шума в среднем
- неравномерность силы сигнала и шума вдоль последовательности
- другие особенности
- Ссылки на исходные файлы в .ab1 формате (для удобства проверяющего)
Примерный порядок действий.
- откройте файл с прямой последовательностью
- вызовите еще раз Chromos, откройте файл с обратной последовательностью и перейдите к комплементарной цепочке
- настройте масштабы по вертикали и горизонтали; по горизонтали - одинаковый масштаб для двух окошек
выровняйте две хроматограммы с использованием поиска подслов (find); повторять эту процедуру придется несколько раз - для каждого проблематичного нуклеотида или участка, т.к. выравнивание сбивается(увы, бесплатная версия не хочет выравнивать хроматограммы )
- определите и запишите в протоколе границы не читаемых 5'- и 3'-участков в каждой последовательности; координаты определяйте по прямой последовательности;
- удалите не читаемые 5'- и 3'- концы; для этого включите опцию Continuous edit
охарактеризуйте на глаз качество каждой хроматограммы
- просмотрите всю прямую последовательность и отредактируйте ее
- типичные сложные места:
- шум выше среднего уровня шума и почти как сигнал;
- пик на нетипичном расстоянии от соседей - вклинился лишний или, наоборот, соседние пики нетипично удалены
- вместо двух или более пиков - один широкий
- проверяйте сложные места по второй цепочке (если она имеется в данном месте)
- типичные сложные места:
- редактирование может состоять в
- замене буквы
- удалении лишней буквы
- вставке буквы между предложенными софтом секвенатора
- все исправления должны быть маленькими буквами!
- сделайте то же со второй последовательностью
сохраните обе последовательности в формате fasta и выровняйте их в JalView
Предостережения.
- Помните, что после "reverse comlement" конец прочтения окажется в начале перевернутой хроматограммы. Это существенно для понимания размера начальных некачественных участков.
Все выравниватели в JalView маленькие буквы превращают в большие. Чтобы сохранить маленькие буквы выровняйте последовательности в JalView вручную (Shift + мышка или Ctrl + мышка позволяют двигать посл-ть). Готовясь, я поступал так: выравнивал программой, потом исхоные последовательности выравнивал вручную, глядя на выравнивание.
На забудьте, что в JalView должна быть установлена раскраска по нуклеотидам!
2. Приведите пример не читаемого фрагмента хроматограммы
Фрагмент можно взять из любого файла. Совсем плохие хроматограммы см. в директории bad там же на диске P
Постарайтесь выбрать фрагмент, про который можно что-то написать.
В отчете - картинка и объяснение.
ААл