Учебный сайт Григория Сафронова

Практикум №8. Поиск по сходству (blast)

1. Определение функции нуклеотидной последовательности из практикума 6 и таксона организма, которому она принадлежала.

Рис.1 Список находок по результатам работы blastn.

Сравние списков находок нуклеотидной последовательности 3-я разными алгоритмами blast

Поиск осуществлялся среди организмов, принадлежащих к родам Loxosomella и Glycera одного семейства.

Ссылка на исходную последовательность

Blastn

Megablast

Discontiguous megablast

Выводы

Алгоритмы blastn и megablast устроены таким образом, что основным критерием для построение выравнивания является полное совпадение участка какой-то длины, с каким-то участком исходной последовательности. Поэтому megablast упускает последовательности, не удовлетворяющие критерию, хотя они и имеют высокое сходство с исходной. Не очень высокие штрафы за гэпы в blastn приводят к находкам, имеющим высокое сходство, но только на очень небольшом участке. Дополнительным критерием поиска в discontiguous megablast является указание длины несовпадающих участков, начиная с которой берутся штрафы за увеличение гэпов. В результате discontiguous megablast находит наиболее сходные последовательности.

3 (3.1). Проверка наличия гомологов 5 белков человека в геноме Drosophila simulans.

HSP7C_HUMAN

TERT_HUMAN

CISY_HUMAN

RPB1_HUMAN

PAB2_HUMAN

4. Классификация геномов родственных вирусов по сходству последовательностей.

Была составлена база данных из полных геномов пяти вирусов:
Bean golden mosaic virus NC_004042.1
Tomato rugose mosaic virus AF291705.1
Macroptilium yellow vein virus JN419021.1
Soybean chlorotic spot virus JX122965.1
Sida golden mosaic Honduras virus Y11097.1
Затем при помощи команд
tblastx -query viri.fasta -db viri.fasta -out blast.out -outfmt 7
python revise_blast_7.py -i blast.out -s 25 -l 50 -e 0.01 -o vir.xls
была получена таблица
ссылка
которая была затем отсортирована по сумме произведений процента идентичности на длину перекрывания. (ниже таблица отсортирована по этим суммам, считавшимся для каждой пары)
Результат (по убыванию):
JN419021.1 NC_004042.1
AF291705.1 NC_004042.1
AF291705.1 JN419021.1
JX122965.1 NC_004042.1
AF291705.1 Y11097.1
JN419021.1 JX122965.1
NC_004042.1 Y11097.1
NC_004042.1 Y11097.1
JN419021.1 Y11097.1
JX122965.1 Y11097.1
AF291705.1 JX122965.1

©Сафронов Григорий