Третий семестр

Задание 1.Поиск организма по фрагменту нуклеотидной последовательности


Был дан фрагмент №25:

  >25
ctgtcgaggatcaacgccgaccttaaaaaggcgaaggtcagcatcatcgggatatccaac
gacctcacgttcaccgactatttagaccccagggttaagtcctcgctgggcgaggaagag
atcatattcccgccatacaacgccgaccagctgcgagacattttggagcagcggagcaag
atggccttcaaggataacaccctggagccggcggtgatcccgctgtgcgcggcgttcgcg
gcccaggagcacggcgacgcccggaaggcgctggacctgctccgagtttctgccgagctg

С помощью программы blastn, алгоритма megablast было определено, что он принадлежит организму Methanocella paludicola SANAE, принадлежащему археям. AC записи - NC_013665. Участок не является кодирующим, его координаты: 1145-1444.

Задание 2. Поиск гомолога белка человека в слоне


Для поиска гомологов был выбран белок VLDLR_HUMAN - Very low-density lipoprotein receptor (VLDL receptor). Поиск проводился на сайте ENA в геноме африканского слона Loxodonta africana с параметром "spliced translated nucleotide search". Было найдено 7 хитов. Данные о лучшей находке:

e-value 4E-310
длина выравнивания 876
identity выравнивания 87%
координаты найденного гена в геноме слона 2968359<-2966619
количество интронов 1

Задание 3. Поиск некодирующих последовательностей программой BLAST


Из генома бактерии Nakamurella multipartita был вырезан участок, кодирующий лейциновую тРНК, с координатами 101478 - 101560. Был проведен поиск гомологов бактерии среди бактерий её порядка Actinomycetales по базе данных nr (Nucleotide collection) разными способами:

Алгоритм Число находок с e-value<0.001 Параметры
megablast 53 длина слова = 28
match/mismatch = 1/-2
blastn 255 длина слова = 11
match/mismatch = 2/-3
(параметры по умолчанию )
blastn 257 длина слова = 7
match/mismatch = 1/-1

Самое маленькое число находок было при применении megablast, так как этот алгоритм ищет максимально близкие последовательности, чем объясняются параметры. При параметрах blast с длиной слова = 7 и match/mismatch = 1/-1 было немного больше находок, так при при этих параметрах алгоритм более чувствителен.

Задание 4. Сравнение программ BLASTN и MegaBLAST


Организмы, в которых были найдены некодирующие последовательности из тРНК из задания 3 c помощью megablast, содержатся и в результатах поиска с помощью blastn. Надо заметить, что длина выравнивания с помощью blastn всегда больше или равна таковой у megablast. В выравниваниях blastn всегда содержатся выравнивания megablast, но нередко присутствуют выравнивания похуже, с меньшим числом совпадений. В параметрах алгоритма megablast длина слова = 28, в отличии от 11 blastn, поэтому программа megablast не может находить выравнивания послабее по определению.