Задание 1.Поиск организма по фрагменту нуклеотидной последовательности
Был дан фрагмент №25:
>25 ctgtcgaggatcaacgccgaccttaaaaaggcgaaggtcagcatcatcgggatatccaac gacctcacgttcaccgactatttagaccccagggttaagtcctcgctgggcgaggaagag atcatattcccgccatacaacgccgaccagctgcgagacattttggagcagcggagcaag atggccttcaaggataacaccctggagccggcggtgatcccgctgtgcgcggcgttcgcg gcccaggagcacggcgacgcccggaaggcgctggacctgctccgagtttctgccgagctg
С помощью программы blastn, алгоритма megablast было определено, что он принадлежит организму Methanocella paludicola SANAE, принадлежащему археям. AC записи - NC_013665. Участок не является кодирующим, его координаты: 1145-1444.
Задание 2. Поиск гомолога белка человека в слоне
Для поиска гомологов был выбран белок VLDLR_HUMAN - Very low-density lipoprotein receptor (VLDL receptor). Поиск проводился на сайте ENA в геноме африканского слона Loxodonta africana с параметром "spliced translated nucleotide search". Было найдено 7 хитов. Данные о лучшей находке:
e-value | 4E-310 |
длина выравнивания | 876 |
identity выравнивания | 87% |
координаты найденного гена в геноме слона | 2968359<-2966619 |
количество интронов | 1 |
Задание 3. Поиск некодирующих последовательностей программой BLAST
Из генома бактерии Nakamurella multipartita был вырезан участок, кодирующий лейциновую тРНК, с координатами 101478 - 101560. Был проведен поиск гомологов бактерии среди бактерий её порядка Actinomycetales по базе данных nr (Nucleotide collection) разными способами:
Алгоритм | Число находок с e-value<0.001 | Параметры |
megablast | 53 | длина слова = 28 match/mismatch = 1/-2 |
blastn | 255 | длина слова = 11 match/mismatch = 2/-3 (параметры по умолчанию ) |
blastn | 257 | длина слова = 7 match/mismatch = 1/-1 |
Самое маленькое число находок было при применении megablast, так как этот алгоритм ищет максимально близкие последовательности, чем объясняются параметры. При параметрах blast с длиной слова = 7 и match/mismatch = 1/-1 было немного больше находок, так при при этих параметрах алгоритм более чувствителен.
Задание 4. Сравнение программ BLASTN и MegaBLAST
Организмы, в которых были найдены некодирующие последовательности из тРНК из задания 3 c помощью megablast, содержатся и в результатах поиска с помощью blastn. Надо заметить, что длина выравнивания с помощью blastn всегда больше или равна таковой у megablast. В выравниваниях blastn всегда содержатся выравнивания megablast, но нередко присутствуют выравнивания похуже, с меньшим числом совпадений. В параметрах алгоритма megablast длина слова = 28, в отличии от 11 blastn, поэтому программа megablast не может находить выравнивания послабее по определению.