Скачать последовательность, полученную в 6 праке.
Использовался megablast. Нашлось 97 последовательностей с айдентити от 99,24% до 83,23%. Заметим, что все лучшие находки принадлежат к роду Eubranchus, но некоторые определены до вида Eubranchus rupium, а некоторые нет. Также абсолютно все лучшие находки кодируют субъединицу один цитохром с оксидазы. На картике ниже представлен верх выдачи бласта и видно, что e-value первых последовательностей стремится к нулю, а айдентити превышает 99%. Из этого можем сделать вывод, что исходная последовательность кодирует субъединицу один цитохром с оксидазы организма рода Eubranchus, возможно, Eubranchus rupium.
Ниже можно увидеть одно из лучших выравниваний.
Score Expect Identities Gaps Strand 1192 bits(645) 0.0 651/656(99%) 0/656(0%) Plus/Plus Query 1 CTCTCTATGTTTTATTAGGGATGTGATGTGGTTTAGTGGGAACTGGACTTAGATTGTTAA 60 |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| Sbjct 3 CTCTCTATGTTTTATTAGGGATGTGATGTGGTTTAGTGGGAACTGGACTTAGATTGTTAA 62 Query 61 TTCGATTTGAGCTAGGGACTGCCGGAGCTTTGCTTGGAGACGATCNTTTGTATAATGTGA 120 ||||||||||||||||||||||||||||||||||||||||||||| |||||||||||||| Sbjct 63 TTCGATTTGAGCTAGGGACTGCCGGAGCTTTGCTTGGAGACGATCATTTGTATAATGTGA 122 Query 121 TTGTAACTGCTCATGCTTTTGTTATAAttttttttATAGTTATACCTCTTATAATTGGGG 180 |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| Sbjct 123 TTGTAACTGCTCATGCTTTTGTTATAATTTTTTTTATAGTTATACCTCTTATAATTGGGG 182 Query 181 GTTTTGGGAATTGAATAGTTCCTCTTTTAATTGGTGCTCCTGATATAAGGTTTCCTCGGA 240 |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| Sbjct 183 GTTTTGGGAATTGAATAGTTCCTCTTTTAATTGGTGCTCCTGATATAAGGTTTCCTCGGA 242 Query 241 TAAATAACATAAGATTCTGGTTGCTTCCTCCTTCTTTTATGCTTTTAATGTCTAGTACAT 300 |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| Sbjct 243 TAAATAACATAAGATTCTGGTTGCTTCCTCCTTCTTTTATGCTTTTAATGTCTAGTACAT 302 Query 301 TAATAGAAGGTGGTGCTGGGACGGGATGGACAGTATACCCTCCTCTCTCTGGTCCTATAG 360 |||||||||||||||||||||||||||||||||||||||||||||| ||||||||||||| Sbjct 303 TAATAGAAGGTGGTGCTGGGACGGGATGGACAGTATACCCTCCTCTTTCTGGTCCTATAG 362 Query 361 GCCATGGGGGTTGTTCTGTAGATCTGGCTATTTTTTCTTTACATTTAGCGGGTATGTCTT 420 |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| Sbjct 363 GCCATGGGGGTTGTTCTGTAGATCTGGCTATTTTTTCTTTACATTTAGCGGGTATGTCTT 422 Query 421 CTCTTTTAGGTGCTATTAACTTTATTACAACTATTTTTAATATACGGTCTCCTGAGATAA 480 |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| Sbjct 423 CTCTTTTAGGTGCTATTAACTTTATTACAACTATTTTTAATATACGGTCTCCTGAGATAA 482 Query 481 CATGAGACCGATTAANTTTATTTGTTTGATCGGTGTTANTTACGGCTTTTTTACTCTTGT 540 ||||||||||||||| |||||||||||||||||||||| ||||||||||||||||||||| Sbjct 483 CATGAGACCGATTAAGTTTATTTGTTTGATCGGTGTTAGTTACGGCTTTTTTACTCTTGT 542 Query 541 TATCACTTCCTGTGCTAGCTGGGGCTATTACNATGTTACTTACGGATCGTAATTTTAATA 600 ||||||||||||||||||||||||||||||| |||||||||||||||||||||||||||| Sbjct 543 TATCACTTCCTGTGCTAGCTGGGGCTATTACGATGTTACTTACGGATCGTAATTTTAATA 602 Query 601 CTAGGTTCTTTGATCCTGCAGGTGGAGGAGATCCTATTTTATATCAACATCTGTTT 656 |||||||||||||||||||||||||||||||||||||||||||||||||||||||| Sbjct 603 CTAGGTTCTTTGATCCTGCAGGTGGAGGAGATCCTATTTTATATCAACATCTGTTT 658
1. Выравнивание гена цитохром с оксидазы.
Было сделано ограничение по роду для меньшего числа находок
Organism: Eubranchus (taxid:71487)
megablast | blastn default | blastn sensitive | |
Длина слова | 28 | 11 | 7 |
Match/mismatch | 1,-2 | 2,-3 | 1,-1 |
Найденных последовательностей | 35 | 74 | 76 |
Графическое саммари выравниваний (в порядке как в таблице).
Дефолтный бласт и чувствительный бласт дали примерно одинаково хорошие результаты. Мегабласт тоже дал хороший результат, но выдал почти вполовину меньше последовательностей.
Выравнивание одного из кодирующих участков генома вируса Escherichia phage vB_Eco4M-7. Скачать последовательность
megablast | blastn default | blastn sensitive | |
Длина слова | 28 | 11 | 7 |
Match/mismatch | 1,-2 | 2,-3 | 1,-1 |
Найденных последовательностей | 7 | 9 | 20 |
Графическое саммари выравниваний (в порядке как в таблице).
Все три вида бласта сработали хорошо, но дефолтный и чувствительный блистн (как и в первом поиске) нашли
больше последовательностей, только в этот раз эти последовательности оказались мусорными или доменными.
Таким образом,что было ожидаемо, мегабласт в обоих поисках нашел меньше последовательностей, только в первом случае его применение оказалось неоправданно,
так как он не показал вполне валидные последовательности, а во втором, наоборот, оправдано, потому что был отсортирован мусор.
Выходной файл.Ищем гистон h2a. Возможно, нашли гомологичные белки. Есть всего три находки с достойным внимания e-value. И мы видим, что в каждой из них консервативными остаются определенные участки (домены), плюс многие замены происходят на схожие по свойствам аминокислоты.
Выходной файл.Можно предположить, что нашлись белки, выполняющие схожую функцию, так как есть очень похожие короткие (доменные) участки.
Выходной файл.Нашелся очень похожий белок (Score = 893 bits (2308), Expect = 0.0, Identities = 478/606 (79%)), на основании данных поика можно сказать, что они гомологичны.
Была взята сборка Amoeboaphelidium X5 c kodomo. Выбирались контиги подходящей длины и с помощью megablast проверялись на наличие какого-нибуд гена.
Ген нашелся в scaffold-6. Какой-то фактор элонгации.