Учебная страница курса биоинформатики,
год поступления 2017
Практикум 6. Чтение последовательностей по Сэнгеру
1. Получить последовательность ДНК на основании данных, полученных из капиллярного секвенатора. Составить отчёт о проблемах при чтении хроматограмм
Пояснения.
Капиллярный секвенатор выдает файлы с хроматограммой и автоматически прочтённой последовательностью в формате .ab1.
Вам дано два файла в формате .ab1, соответствующие прочтению прямой и обратной цепочки секвенируемой ДНК. См. список данных, файлы лежат на диске P в соответствующей директории: P:\y17\term3\block2\ab1_files.
Для просмотра хроматограмм и редактирования автоматического прочтения будем использовать программу Chromas (Lite).
Отчет должен быть представлен на странице вашего сайта.
Термины
Проблемный нуклеотид — тот, по которому вы приняли решение, отличное от предложенного программой, или вы согласились с программой, но необходимо было проанализировать хроматограммы и принять решение. Проблемные нуклеотиды в последовательности выделяйте строчными буквами.
Полиморфизм — это нуклеотид, про который вы решили, что в секвенируемой ДНК встречаются два (или более) варианта. Полиморфизмы обозначайте кодами вырожденных нуклеотидов (ambiguity codes), см. https://droog.gs.washington.edu/parc/images/iupac.html.
Что должно быть в отчёте.
Ссылка на файл с результатом — последовательностью в fasta формате.
JalView-проект с выравниванием прямого и обратного прочтений (тех частей, которые вы признали пригодными).
- Обоснование ваших решений для четырех-пяти проблемных нуклеотидов или полиморфизмов. Обоснование должно включать:
картинку с выровненными хроматограммами окрестности проблемного нуклеотида, достаточную для оценки ситуации (по три – четыре нуклеотида с каждой стороны);
- ваше решение и обоснование.
- Характеристику хроматограммы в целом:
- длины начального и конечного нечитаемых участков для прямого и обратного прочтений;
- оценку (на глаз) отношения сигнала и шума в среднем;
- неравномерность силы сигнала и шума вдоль последовательности;
- другие особенности.
- Ссылки на исходные файлы в .ab1 формате (для удобства проверяющего).
Примерный порядок действий.
- Запустите Chromas, откройте файл с прямой последовательностью.
- Вызовите еще раз Chromas, откройте файл с обратной последовательностью и перейдите к комплементарной цепочке.
Настройте масштабы по вертикали и горизонтали; по горизонтали — одинаковый масштаб для двух окошек.
Найдите соответствующие участки двух хроматограмм. Разумно использовать поиск подслов (find); повторять эту процедуру придется несколько раз, для каждого проблематичного нуклеотида или участка, т.к. выравнивание сбивается (увы, бесплатная версия не хочет выравнивать хроматограммы ).
- Определите и запишите в протоколе границы нечитаемых 5'- и 3'-участков в каждой последовательности; координаты определяйте по прямой последовательности.
- Удалите нечитаемые 5'- и 3'- концы; для этого включите опцию Continuous edit.
Охарактеризуйте на глаз качество каждой хроматограммы.
- Просмотрите всю прямую последовательность и отредактируйте ее:
- типичные сложные места:
- шум выше среднего уровня шума и почти как сигнал;
- пик на нетипичном расстоянии от соседей: вклинился лишний или, наоборот, соседние пики нетипично удалены;
вместо двух или более пиков — один широкий.
- Проверяйте сложные места по второй цепочке (если она имеется в данном месте);
- типичные сложные места:
- Редактирование может состоять в:
- замене буквы;
- удалении лишней буквы;
вставке буквы между предложенными софтом секвенатора.
Все исправления должны быть маленькими буквами!
- Проделайте то же со второй последовательностью.
- Сохраните обе последовательности в формате fasta.
Выровняйте последовательности программой needle; выравнивание получите в формате fasta (читайте needle -help -verbose).
Импортируйте в JalView, раскрасьте по нуклеотидам и сохраните проект.
Предостережения.
- Помните, что после "reverse complement" конец прочтения окажется в начале перевернутой хроматограммы. Это существенно для понимания размера начальных некачественных участков.
Все выравниватели в JalView маленькие буквы превращают в большие, поэтому рекомендуется выравнивать needle'ом, а уже потом импортировать в JalView.
2. Приведите пример нечитаемого фрагмента хроматограммы
Фрагмент можно взять из любого файла. Совсем плохие хроматограммы см. в директории bad там же на диске P.
Постарайтесь выбрать фрагмент, про который можно что-то написать.
В отчете — картинка и объяснение.
Для просмотра хроматограмм и редактирования автоматического прочтения будем использовать программу Unipro Ugene.