Выравнивание по Сенгеру
В данном практикуме необходимо было прочитать последовательность ДНК на основании данных, полученных из капиллярного секвенатора по Сэнгеру с помощью программы Chromas.
Оба файла (прямая и обратная последовательности) были открыты в программе Chromas. Для обратной цепи была открыта комплементарная последовательность. После чего хроматограммы были выровнены с сохранением масштаба, а также с помощью поиска подслов (find).
Нечитаемые участки для обеих цепей (для обратной цепи использовалась комплементарная последовательность):
Прямая цепь: 5' 1-25, для 3'-конца начиная с 676-го нуклеотида, однако неопределенных нуклеотидов не так много, резкого ухужшения качества хроматограммы не происходит. В принципе, наверное, можно сказать, что нечитаемый участок здесь отсутствует.
Обратная цепь: со стороны 5'-конца нечитаемый участок, можно сказать, отсутствует, т.к. невозможно определить только первые 2 нуклеотида, для 3’-конца нечитаемый участок начинается с 676-го нуклеотида, хотя качество хроматограммы остается достаточно высоким для прочтения еще порядка 10-ти нуклеотидов, к тому же участок цепи с 689-го по 697-й нуклеотид возможно использовать для проверки прямой цепи, совмещая комплементарные участки второй и первой хроматограмм, что позволит добиться минимального количества ошибок при прочтении нуклеотидной последовательности; и только с 698-го нуклеотида и до конца последовательности качество хроматограммы резко ухудшается, делая прочтение невозможным.
26 нуклеотид прямой цепи, (до которого идет нечитаемый участок) соответствует 60-му нуклеотиду обратной цепи.
После удаления нечитаемых участков и замены проблемных нуклеотидов, в Jalview было получено выравнивание. Получившаяся после выравнивания последовательность (1-616)
WS2960/1-650: ATATTTGGCGCTTGAGCAGGCACAGTAGGGACTGCTATGAGAAAAATTATACGAGTTGAACTTTCTCAGCCA
GGCTCTTTGATACAAGATGATCAAGTGTATAAAGTTATGGTAACGGCCCACGCCTTCGTCATGATATTTTTC
ATGGTAATGCCCATAATGATAGGAGGATTTGGCAAATGACTTATCCCACTAATGTTAGGAGCACCTGATATG
GCTTTCCCCCGTATGAAaAAAATGAGATTTTGACTGCTACCCCCAGCTTTTATACTTCTTCTAGCTTCAGCT
GCAAACGAAGGAGGAGTAGGCACTGGGTGAaCTGTTTATCCCCCTTTGtCAgGCCCTACCgCACATGCAGgA
GGATGCGTAGACCTCGCAATTTTTTCTCTCCACCTAgCAGGTGCATCTTCAATTATGGCCTCAaTAAAATTT
ATTACAACTATtATAAATATGCGTAGGCCCGGCATGACCATGGATCGACTTCCACTTTTTGTTTGATCTATT
TTCTTAaCAACTATATTACTACTCCTTTCTCTACCTGTTTTAGCAGGAGCTATTACAATGCTACTAACTGAT
CGTAACATAAAAACAACGTTCTTTGATCCTAcAGGGGGAG(начало нечитаемого конца второй цепи)…
WS2960/42-657
ATATTTGGCGCTTGAGCAGGCACAGTAGGGACTGCTATGAGAAAAATTATACGAGTTGAACTTTCTCAGCCA
GGCTCTTTGATACAAGATGATCAAGtGTATAAAGTTATGGTAACGGCCCACGCCTTcGTCATGATATTTTTC
ATGGTAATGCCCATAATGATAGGAGGATTTGGCAAATGACTTATCCCACTAATGTTAGGAGCACCTGATATG
GCTTTCCCCCGTATGAAAAAAATGAGATTTTGACTGCTACCCCCAGCTTTTATACTTCTTCTAGCTTCAGCT
GCAAACGAAGGAGGAGTAGGCaCTGGGTGAACTGTTTATCCCCCTTTGTCAGGCCCTACCGCACATGCAGGA
GGATGCGTAGACCTCGCAATTTTTTCTCTCCaCCTAGCAGGTGCATCTTCAATTATGGCCTCAATAAAATTT
ATTACAACTATTATAAATATGCGTAGGCCCGGCATGACCATGGATCGACTTCCACTTTTTGTTTGATCTATT
TTCTTAACAACTATATTACTACTCCTTTCTCTACCTGTTTTAGCAGGAGCTATTACAATGCTACTAACTGAT
CGTAACATAAAAACAACGTTCTTTGATCCTACAGGGGGAG(нечитаемый конец )…

Причины тех или иных замен нуклеотидов
Все примеры из прямой последовательности будут располагаться слева, а из обратной – справа

На рисунке 1а видно, что на участке прямой последовательности, комплементарному другому такому участку (рис. 1б) второй (обратной) цепи имеется четыре гуанина, в то время как в обратной последовательности их только три. Было принято решение убрать 54-й нуклеотид (гуанин) из прямой последовательности, т.к. хроматограмма данного участка обратной цепи с тремя гуанинами лучшего качества(на хроматограмме прямой цепи пик 54-го нуклеотида наползает на 53-й (аденин), к тому же, с учетом цветовой заполненности квадратиков над обозначениями нуклеотидов можно сказать, что программа Chromas считает результат 54=гуанин достаточно точным )и, следовательно, более надежная.

На хроматограмме обратной цепи не определен нуклеотид 157, т.к. сигнал сравним по уровню с шумом. В то же время на хроматограмме прямой цепи (нуклеотид 123) сигнал достаточно высокого качества, и можно сделать вывод, что он сильный. Поэтому для обратной последовательности была сделана замена на тимин.

На данном фрагменте прямой и обратной цепей не определены нуклеотиды (422 – прямая, 451-обратная). Сложности с определение нуклеотида 422 возникают по причине того, что сигнал слился с шумом. Однако на хроматограмме обратной цепи сигнал от этого нуклеотида четкий.
Поэтому производим замену в прямой цепи на гуанин. С нуклеотидом 451 ситуация не такая однозначная. На хроматограмме фрагмента прямой цепи нуклеотид, комплементарный 451-му, был определен программой как аденин. Однако, если начать сравнивать сигналы от этих нуклеотидов (417 – прямая, 451- обратная), то окажется, что они не так сильно отличаются: на обеих хроматограммах уровень шума сопоставим по силе с уровнем сигнала. Также наличие шума в хроматограмме не позволяет утверждать, что оба пика (зеленый – аденин, синий –цитозин) – сигналы. И т.к. программа определила на прямой цепи нуклеотид 417 как аденин с достаточной точностью (цветовое заполнение квадратика над буквенным обозначением), и сам пик четкий, было принято решение обозначить нуклеотид 451 в обратной цепи как аденин.

На фрагменте обратной цепи, начиная с 688-го нуклеотида, начинает снижаться качество хроматограммы (что связано с приближением к концу цепи). Однако, ее еще можно использовать для проверки точности определения прямой последовательности. Тем временем, хроматограмма прямой последовательности сохраняет хорошее качество, хотя сигнал становится хуже (пики ниже). Таким образом, можно, опираясь на хроматограмму прямой цепи, достроить обратную последовательность до разумных пределов (к примеру, до 691-го нуклеотида). Обозначаем нуклеотиды обратной последовательности 689, 690 и 691 как тимин.
После анализа хроматограмм относительно достоверной была принята последовательность нуклеотидов 26-641(по прямой цепи), которая была записана в файл fasta.
В целом уровень шума порой был достаточно высок, в некоторых случаях сравним с сигналами от нуклеотидов, что затрудняло чтение хроматограммы. Резких ухудшений качества обнаружено не было. Передние и задние концы не читаемы из-за наличия фрагментов, на которых отжигается праймер (см. презентацию). Однако, сопоставляя данные с обеих хроматограмм позволяет производить замены и делать выводы о правильности определения нуклеотидов на некоторых фрагментах последовательностей.
Пример нечитаемой хроматограммы:

Множество пиков, наползающих друг на друга и делающих точное определение конкретного нуклеотида невозможным. Возможно, что в препарате читаются одновременно несколько разных фрагментов ДНК. Так же возможно, что праймер для секвенирования отжегся на нескольких различных участках.