Учебная страница курса биоинформатики,
год поступления 2016
Срок: 10:55 17 октября (без потерь) или 24 октября (минус полбалла).
Моментом сдачи задания считается момент записи в очередь!
Практикум 6. Чтение последовательностей по Сэнгеру
1. Прочитать последовательность ДНК на основании данных, полученных из капиллярного секвенатора по Сэнгеру. Составить отчёт о проблемах при чтении хроматограмм
Пояснения.
Капиллярный секвенатор выдает файлы с хроматограммой и автоматически прочтённой последовательностью в формате .ab1.
Вам дано два файла в формате .ab1, соответствующие прочтению прямой и обратной цепочки секвенируемой ДНК. См. список данных, файлы лежат на диске P в соответствующей директории: P:\y16\term3\block2\ab1_files
Для просмотра хроматограмм и редактирования автоматического прочтения будем использовать программу Chromas (Lite).
Отчет должен быть представлен на странице вашего сайта.
Термины
Проблемный нуклеотид — тот, по которому вы приняли решение, отличное от предложенного программой, или вы согласились с программой, но необходимо было проанализировать хроматограммы и принять решение.
Проблемные нуклеотиды в последовательности выделяйте строчными буквами.
Полиморфизм — нуклеотид, про который вы решили, что в секвенируемой ДНК встречаются два (или более) варианта.
Полиморфизмы обозначайте кодами вырожденных нуклеотидов (ambiguity codes), см. https://droog.gs.washington.edu/parc/images/iupac.html.
Что должно быть в отчёте.
Ссылка на файл с результатом — последовательностью в fasta формате с выделенными строчными буквами проблемными нуклеотидами и полиморфизмами.
JalView-проект с выравниванием прямого и обратного прочтений (тех частей, которые вы признали пригодными); выделите проблемные нуклеотиды и полиморфизмы.
- Обоснование ваших решений для четырех-пяти проблемных нуклеотидов или полиморфизмов:
картинка с выровненными хроматограммами окрестности проблемного нуклеотида, достаточной для оценки ситуации (по три – четыре с каждой стороны);
- ваше решение и обоснование.
- Характеристику хроматограммы в целом:
- длины начального и конечного нечитаемых участков для прямого и обратного прочтений;
- оценку (на глаз) отношения сигнала и шума в среднем;
- неравномерность силы сигнала и шума вдоль последовательности;
- другие особенности.
- Ссылки на исходные файлы в .ab1 формате (для удобства проверяющего).
Примерный порядок действий.
- откройте файл с прямой последовательностью;
- вызовите еще раз Chromas, откройте файл с обратной последовательностью и перейдите к комплементарной цепочке;
настройте масштабы по вертикали и горизонтали; по горизонтали — одинаковый масштаб для двух окошек;
- найдите соответствующие участки двух хроматограмм; разумно использовать поиск подслов (find); повторять эту процедуру придется несколько раз, для каждого проблематичного нуклеотида или участка, т.к. выравнивание сбивается (увы, бесплатная версия не хочет выравнивать хроматограммы:( )
- определите и запишите в протоколе границы нечитаемых 5'- и 3'-участков в каждой последовательности; координаты определяйте по прямой последовательности;
- удалите нечитаемые 5'- и 3'- концы; для этого включите опцию Continuous edit;
охарактеризуйте на глаз качество каждой хроматограммы;
- просмотрите всю прямую последовательность и отредактируйте ее:
- типичные сложные места:
- шум выше среднего уровня шума и почти как сигнал;
- пик на нетипичном расстоянии от соседей: вклинился лишний или, наоборот, соседние пики нетипично удалены;
вместо двух или более пиков — один широкий
- проверяйте сложные места по второй цепочке (если она имеется в данном месте);
- типичные сложные места:
- редактирование может состоять в:
- замене буквы;
- удалении лишней буквы;
- вставке буквы между предложенными софтом секвенатора;
- все исправления должны быть маленькими буквами!
- сделайте то же со второй последовательностью;
- сохраните обе последовательности в формате fasta;
выровняйте последовательности программой needle; выравнивание получите в формате fasta (читайте needle -help -verbose);
импортируйте в JalView.
Предостережения.
- Помните, что после "reverse complement" конец прочтения окажется в начале перевернутой хроматограммы. Это существенно для понимания размера начальных некачественных участков.
Все выравниватели в JalView маленькие буквы превращают в большие, поэтому рекомендуется выравнивать needle'ом, а уже потом импортировать в JalView.
На забудьте, что в JalView должна быть установлена раскраска по нуклеотидам!
2. Приведите пример нечитаемого фрагмента хроматограммы
Фрагмент можно взять из любого файла. Совсем плохие хроматограммы см. в директории bad там же на диске P.
Постарайтесь выбрать фрагмент, про который можно что-то написать.
В отчете — картинка и объяснение.