Скачать последовательность, полученную в 6 праке.

Что это за последовательность

Использовался megablast. Нашлось 97 последовательностей с айдентити от 99,24% до 83,23%. Заметим, что все лучшие находки принадлежат к роду Eubranchus, но некоторые определены до вида Eubranchus rupium, а некоторые нет. Также абсолютно все лучшие находки кодируют субъединицу один цитохром с оксидазы. На картике ниже представлен верх выдачи бласта и видно, что e-value первых последовательностей стремится к нулю, а айдентити превышает 99%. Из этого можем сделать вывод, что исходная последовательность кодирует субъединицу один цитохром с оксидазы организма рода Eubranchus, возможно, Eubranchus rupium.

g


g

Ниже можно увидеть одно из лучших выравниваний.

Score	Expect	Identities	Gaps	Strand
1192 bits(645)	0.0	651/656(99%)	0/656(0%)	Plus/Plus
Query  1    CTCTCTATGTTTTATTAGGGATGTGATGTGGTTTAGTGGGAACTGGACTTAGATTGTTAA  60
            ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  3    CTCTCTATGTTTTATTAGGGATGTGATGTGGTTTAGTGGGAACTGGACTTAGATTGTTAA  62

Query  61   TTCGATTTGAGCTAGGGACTGCCGGAGCTTTGCTTGGAGACGATCNTTTGTATAATGTGA  120
            ||||||||||||||||||||||||||||||||||||||||||||| ||||||||||||||
Sbjct  63   TTCGATTTGAGCTAGGGACTGCCGGAGCTTTGCTTGGAGACGATCATTTGTATAATGTGA  122

Query  121  TTGTAACTGCTCATGCTTTTGTTATAAttttttttATAGTTATACCTCTTATAATTGGGG  180
            ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  123  TTGTAACTGCTCATGCTTTTGTTATAATTTTTTTTATAGTTATACCTCTTATAATTGGGG  182

Query  181  GTTTTGGGAATTGAATAGTTCCTCTTTTAATTGGTGCTCCTGATATAAGGTTTCCTCGGA  240
            ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  183  GTTTTGGGAATTGAATAGTTCCTCTTTTAATTGGTGCTCCTGATATAAGGTTTCCTCGGA  242

Query  241  TAAATAACATAAGATTCTGGTTGCTTCCTCCTTCTTTTATGCTTTTAATGTCTAGTACAT  300
            ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  243  TAAATAACATAAGATTCTGGTTGCTTCCTCCTTCTTTTATGCTTTTAATGTCTAGTACAT  302

Query  301  TAATAGAAGGTGGTGCTGGGACGGGATGGACAGTATACCCTCCTCTCTCTGGTCCTATAG  360
            |||||||||||||||||||||||||||||||||||||||||||||| |||||||||||||
Sbjct  303  TAATAGAAGGTGGTGCTGGGACGGGATGGACAGTATACCCTCCTCTTTCTGGTCCTATAG  362

Query  361  GCCATGGGGGTTGTTCTGTAGATCTGGCTATTTTTTCTTTACATTTAGCGGGTATGTCTT  420
            ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  363  GCCATGGGGGTTGTTCTGTAGATCTGGCTATTTTTTCTTTACATTTAGCGGGTATGTCTT  422

Query  421  CTCTTTTAGGTGCTATTAACTTTATTACAACTATTTTTAATATACGGTCTCCTGAGATAA  480
            ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  423  CTCTTTTAGGTGCTATTAACTTTATTACAACTATTTTTAATATACGGTCTCCTGAGATAA  482

Query  481  CATGAGACCGATTAANTTTATTTGTTTGATCGGTGTTANTTACGGCTTTTTTACTCTTGT  540
            ||||||||||||||| |||||||||||||||||||||| |||||||||||||||||||||
Sbjct  483  CATGAGACCGATTAAGTTTATTTGTTTGATCGGTGTTAGTTACGGCTTTTTTACTCTTGT  542

Query  541  TATCACTTCCTGTGCTAGCTGGGGCTATTACNATGTTACTTACGGATCGTAATTTTAATA  600
            ||||||||||||||||||||||||||||||| ||||||||||||||||||||||||||||
Sbjct  543  TATCACTTCCTGTGCTAGCTGGGGCTATTACGATGTTACTTACGGATCGTAATTTTAATA  602

Query  601  CTAGGTTCTTTGATCCTGCAGGTGGAGGAGATCCTATTTTATATCAACATCTGTTT  656
            ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  603  CTAGGTTCTTTGATCCTGCAGGTGGAGGAGATCCTATTTTATATCAACATCTGTTT  658

Сравнение разных бластов

1. Выравнивание гена цитохром с оксидазы.
Было сделано ограничение по роду для меньшего числа находок
Organism: Eubranchus (taxid:71487)

megablast blastn default blastn sensitive
Длина слова 28 11 7
Match/mismatch 1,-2 2,-3 1,-1
Найденных последовательностей 35 74 76

Графическое саммари выравниваний (в порядке как в таблице).

g
g
g

Дефолтный бласт и чувствительный бласт дали примерно одинаково хорошие результаты. Мегабласт тоже дал хороший результат, но выдал почти вполовину меньше последовательностей.

Выравнивание одного из кодирующих участков генома вируса Escherichia phage vB_Eco4M-7. Скачать последовательность

megablast blastn default blastn sensitive
Длина слова 28 11 7
Match/mismatch 1,-2 2,-3 1,-1
Найденных последовательностей 7 9 20

Графическое саммари выравниваний (в порядке как в таблице).

g
g
g

Все три вида бласта сработали хорошо, но дефолтный и чувствительный блистн (как и в первом поиске) нашли больше последовательностей, только в этот раз эти последовательности оказались мусорными или доменными.
Таким образом,что было ожидаемо, мегабласт в обоих поисках нашел меньше последовательностей, только в первом случае его применение оказалось неоправданно, так как он не показал вполне валидные последовательности, а во втором, наоборот, оправдано, потому что был отсортирован мусор.

Поиск гомологов в геноме

Выходной файл.Ищем гистон h2a. Возможно, нашли гомологичные белки. Есть всего три находки с достойным внимания e-value. И мы видим, что в каждой из них консервативными остаются определенные участки (домены), плюс многие замены происходят на схожие по свойствам аминокислоты.

Выходной файл.Можно предположить, что нашлись белки, выполняющие схожую функцию, так как есть очень похожие короткие (доменные) участки.

Выходной файл.Нашелся очень похожий белок (Score = 893 bits (2308), Expect = 0.0, Identities = 478/606 (79%)), на основании данных поика можно сказать, что они гомологичны.

Поиск гена в одном из контигов

Была взята сборка Amoeboaphelidium X5 c kodomo. Выбирались контиги подходящей длины и с помощью megablast проверялись на наличие какого-нибуд гена. Ген нашелся в scaffold-6. Какой-то фактор элонгации.
g