Чтение последовательностей по СэнгеруЗадание 1. Чтение последовательности ДНК на основании данных, полученных из капиллярного секвенатора по Сэнгеру.Капиллярный секвенатор выдает файлы с хроматограммой и автоматически прочтённой последовательностью в формате .ab1. Вам дано два файла в формате .ab1, соответствующие прочтению прямой и обратной цепочки секвенируемой ДНК. См. список данных, файлы лежат на диске P в соответствующей директории: P:\y16\term3\block2\ab1_files Для просмотра хроматограмм и редактирования автоматического прочтения будем использовать программу Chromas (Lite). Ссылка на файл с результатом — последовательностью в fasta формате с выделенными строчными буквами проблемными нуклеотидами и полиморфизмами. Ссылка на файл с прямой цепочкой секвенируемой ДНК (fasta) Ссылка на файл с обратной цепочкой секвенируемой ДНК (fasta) Ссылка на файл с прямой цепочкой секвенируемой ДНК в .ab1 формате Ссылка на файл с обратной цепочкой секвенируемой ДНК в .ab1 формате
Рис.1. Выравнивание в JalView с выделенными проблемными участками Выполненные исправления в прямой цепи: 1)№56: N=>y 2)№58: N=>a 3)№60: N=>t 4)№373: N=>g 5)№654: N=>y 6)№657: N=>y Также стоит отметить большой пик: №54-№55 и расплывчатый пик №56. Обоснования решений: В позициях 55-58 образовался большой расплывчатый пик из-за которого нельзя однозначно определить нуклеотиды №56 и №58 по прямой цепи. В позиции 56 заметны 2 пика, чтобы понять какой именно нуклеотид находится в этом месте, пришлось сравнить это место с обратной последовательностью. В обратной последовательности эта позиция определяется однозначно - g. В позиции 58, если смотреть по пикам, то явно определяяется а, но так как совсем рядом идет пересечение, то лучше все равно убедиться в этом по обратному прочтению. Там тоже однозначно определяется а. С позицией 60 - аналогичная история: проверка по обратной последовательности. В позиции 373 шум выходит на уровень сигнала, поэтому лучше сделать в этом месте проверку. Находим соответствующий фррагмент на обратной последовательности и видим, что там в этом месте такой проблемы нет. Следовательно, можем однозначно определить. Выполненные исправления в обратной цепи: №597: N=>t №379: N=>c №51: N=>c №33: N=>y №36: N=>r №39: N=>y Здесь стоит упомянуть большой пик №638-№640. (нумерация по соответствующей цепи) Рис.2. Участок с проблемными нуклеотидами.
Рис.3. Участок с проблемными нуклеотидами.
2. Приведите пример нечитаемого фрагмента хроматограммы.В задании требовалось рассмотреть нечитаемую хроматограмму. Рис.3. Плохая хроматограмма
|
|
© Cherkashina Anastasia 2017 |