Visualization of molecules (Визуализация молекул)
Innards of proteins (Внутренности белков)
Hydrogen bonds between the protein and DNA (Водородные связи между белком и ДНК)
Search in databases (Поиск в базах данных)
Alignment and homology (Выравнивание и гомология)
Predicting the pairwise alignment (Предсказание парных выравниваний)
После запуска BLAST с параметрами (алгоритм - blastp; база данных - Refseq_protein; max target sequence - 20000). Было найдено 13658 последовательностей, среди которых могут быть повторяющиеся организмы. Среди них 833 клеточных организма. 0 прокариот; археи: 445 находок для 402 организмов; Verrucomicrobia bacterium SCGC AAA164-O14: 1 находка в 1 организме; эукариоты: 766 находок в 430 организмах.
Сравнение находок.
В качестве "лучшей" была взята последовательность из генома Pyrococcus sp. ST04, так как первая находка соответствует исходному белку, а в качестве "худшей" была взята находка из конца списка.
Организм | Длина выравнивания | Bit Score | E-value | % идентичных остатков | % сходных остатков |
Pyrococcus sp. ST04 | 968 | 781 | 0.0 | 47% | 62% |
Sideroxydans lithotrophicus | 943 | 202 | 4e-50 | 26% | 40% |
Welwitschia mirabilis | 239 | 53.5 | 9e-04 | 24% | 41% |
Выравнивания, построенные BLAST:
Для последовтельности из середины.
Гомологами исходной последовательности можно считать те, у которых E-value < 1e-3 и Query cover не менее 70%. Для поиска гомологов было задано максимальное значение E-value 9e-04 в formatting options.
Поиск велся среди организмов домена Bacteria. Стратегия поиска.
Сравнив полученный список со списком задания 1, я выбрала одну последовательность, которая принадлежала сразу двум - DNA-directed RNA polymerase subunit A'/A'' [Verrucomicrobia bacterium SCGC AAA164-O14]. В пользу того, что это одна и та же последовательность, свидетельствует одинаковый Sequence ID: ref|WP_019112151.1| и одинакова длина - 1264 ак. Выравнивания, Score, E-value находок полностью совпадают. E-value зависит от размера банка. Если второй банк был большим, то оно не изменилось.
Для последовательности DNA-directed RNA polymerase subunit A' [Pyrococcus furiosus] ref|WP_014835440.1| было выполнено выравнивание. Стратегия поиска.
Карта локального сходства показывает, что выравнивание содержит много консервативных и сходных позиций, однако по данным файла выравнивания, оно содержит 11% гэпов.
Для выполнения задания в качестве базы данных было использовано выравнивание align_08.fasta из задания 8. Из выравнивания были удалены все гэпы.
Выдача программы для лучшей находки:
Score = 24.6 bits (52), Expect = 0.018, Identities = 9/24 (38%), Positives = 15/24 (63%), Gaps = 0/24 (0%). Score лучшей находки намного меньше, чем при поиске в больших базах данных. E-value большой, несмотря на малый размер БД. Эти данные свидетельствуют об отсутствии гомологии между последовательностями.