BLAST

Anna Zheltova

Second term (Второй семестр):

Visualization of molecules (Визуализация молекул)

Innards of proteins (Внутренности белков)

Hydrogen bonds between the protein and DNA (Водородные связи между белком и ДНК)

Databases (Базы данных)

Search in databases (Поиск в базах данных)

Alignment and homology (Выравнивание и гомология)

Predicting the pairwise alignment (Предсказание парных выравниваний)

BLAST

PSI-BLAST

pr13

Homepage (Главная страница)

Задание 1.

После запуска BLAST с параметрами (алгоритм - blastp; база данных - Refseq_protein; max target sequence - 20000). Было найдено 13658 последовательностей, среди которых могут быть повторяющиеся организмы. Среди них 833 клеточных организма. 0 прокариот; археи: 445 находок для 402 организмов; Verrucomicrobia bacterium SCGC AAA164-O14: 1 находка в 1 организме; эукариоты: 766 находок в 430 организмах.

Сравнение находок.

В качестве "лучшей" была взята последовательность из генома Pyrococcus sp. ST04, так как первая находка соответствует исходному белку, а в качестве "худшей" была взята находка из конца списка.

Организм Длина выравнивания Bit Score E-value % идентичных остатков % сходных остатков
Pyrococcus sp. ST04 968 781 0.0 47% 62%
Sideroxydans lithotrophicus 943 202 4e-50 26% 40%
Welwitschia mirabilis 239 53.5 9e-04 24% 41%

Выравнивания, построенные BLAST:

Для лучшей.

Для последовтельности из середины.

Для худшей.

Гомологами исходной последовательности можно считать те, у которых E-value < 1e-3 и Query cover не менее 70%. Для поиска гомологов было задано максимальное значение E-value 9e-04 в formatting options.

Стратегия поиска.

Задание 2.

Поиск велся среди организмов домена Bacteria. Стратегия поиска.

Сравнив полученный список со списком задания 1, я выбрала одну последовательность, которая принадлежала сразу двум - DNA-directed RNA polymerase subunit A'/A'' [Verrucomicrobia bacterium SCGC AAA164-O14]. В пользу того, что это одна и та же последовательность, свидетельствует одинаковый Sequence ID: ref|WP_019112151.1| и одинакова длина - 1264 ак. Выравнивания, Score, E-value находок полностью совпадают. E-value зависит от размера банка. Если второй банк был большим, то оно не изменилось.

Задание 3.

Для последовательности DNA-directed RNA polymerase subunit A' [Pyrococcus furiosus] ref|WP_014835440.1| было выполнено выравнивание. Стратегия поиска.

Карта локального сходства показывает, что выравнивание содержит много консервативных и сходных позиций, однако по данным файла выравнивания, оно содержит 11% гэпов.

Выравнивание.

Задание 4.

Для выполнения задания в качестве базы данных было использовано выравнивание align_08.fasta из задания 8. Из выравнивания были удалены все гэпы.

Выдача программы для лучшей находки:

Score = 24.6 bits (52), Expect = 0.018, Identities = 9/24 (38%), Positives = 15/24 (63%), Gaps = 0/24 (0%). Score лучшей находки намного меньше, чем при поиске в больших базах данных. E-value большой, несмотря на малый размер БД. Эти данные свидетельствуют об отсутствии гомологии между последовательностями.

© 2014 Anna Zheltova (Анна Желтова)