Задание 1. Получение последовательности фрагмента ДНК.
1. Исходные файлы с хроматограммами:
прямая цепь (в fasta формате)
обратная цепь (в fasta формате)
2. Выравнивание прямой и комплементарной к обратной последовательности в проекте JalView:
проект
Маленькими буквами отмечегны нуклеотиды, которые были изменены.
3. "Чистая" последовательность прямой цепи в формате
fasta.
Порядок выполнения работы:
1) С помощью программы Chromos я открыла 2 файла с хромотограммами прямой и обратной цепи фрагмента ДНК.
2) Затем я изменила обратную цепь на комплементарную ей и "переписала" её наоборот (для этого была использована программа reserve complement).
Такая замена была осуществлена для того, чтобы можно было сравнивать последовательности обеих цепей.
3) Далее я выровняла последовательности относительно друг друга, используя опцию find.
4) Определив границы нечитаемых 5'- и 3'-концов каждой последовательности, я их удалила.
Границы нечитаемых участков:
|
Цепь |
|
|
Прямая |
Компплементарная к обратной |
5' нечитаемый участок |
1-32 |
1-25 |
3' нечитаемый участок |
673-до конца |
688-до конца |
5) Теперь оченим качество кождой хроматограммы:
Прямая цепь:
В среднем сигнал превосходит шум в 8 раз.
Средняя сила сигнала вдоль оси X равномерна.
Cила шума заметно увеличивается к концу хроматограммы где-то в 4 раза.
У разных очевидных сигналов сила может различаться в 7 раз. Самый сильны разброс наблюдается у нуклеотидов G и A,
когда T и C принимают средние значения почти на всём промежутке.
Обратная цепь:
В среднем сигнал превосходит шум в 6 раз.
Средняя сила сигнала вдоль оси X практически равномерна, только увеличивается в самом конце хроматограммы отдельными фоагментами.
Сила шума в середине участка равномерна, по краям она немного выше.
Сила у разных очевидных сигналов может отличаться в 15 раз. Самые высокие пики чаще всего наблюдаются у С.
Хроматограмма хорошая, но хуже первой.
6) Редактирование прямой последовательности:
Сначала приведу пример хорошо получившегося участка, прочтение которого однозначно.
"клякса" в области 75-85
Пики накладываются друг на друга, также слишком силен шум.
К счастью,
на обратной цепи проблем в этом месте нет, и последовательность полностью восстанавливается.
Слабый сигнал на фоне сильного шума. Сильный шум или наложение пиков в позициях 607, 673, 676, 679, 685.
К сожалению, обратная цепь не позволяет понять, что в этих позициях должено стоять.
Но можно сделать предположение, что в 607 позиции стоит T, a пик G является просто результатом шума.
Однако в других позициях ситуация совсем не может быть предугадана, поэтому в 673 позиции ставлю r (там может стоять как G, так и А),
а в поцициях 676, 679 и 685 ставлю y (там с одинаковой вероятностью может быть как С, так и Т).
Аналогично были присвоены названия оставшимся неоднознаяным позициям.
691 - r
703 - g
710 - c
711 - c
721 - w
714 - a
Редактирование обратной цепи
"кляксы" в позициях 595-605 и 630-650
Большую часть этой области программа прочитала правильно. Сравнение с прямой цепочкой позволило полностью восстановить последовательность.
Задание 2. Привести пример нечитаемой хроматограммы.
Прочитать такую хроматограмму невозможно, так как пики накладываются друг на друга. (шум и сигнал сливаются).
СПАСИБО ЗА ПРОСМОТР
© Мария Медведева