Работа с программой BLAST

Цель задания - знакомство с программой BLASTP.

Задание 1: провести поиск своей последовательности программой BLASTP. a) провести поиск своей последовательности программой BLASTP в банке swissprot. В выдаче программы отыскать мой белок и занести в протокол: его порядковый номер в выдаче (1); Score (2196); E-value (0.0);б) повторить поиск с той же входной последовательностью, указав в качестве банка pdb. Для первой в списке находки указать: PDB-коды и идентификаторы цепей, Score, E-value, начало и конец выравнивания во входной последовательности (Query) и в находке (Subject), процент совпадений (Identity). PDB-коды (1KMN, 1KMM); идентификаторы цепей (D, C, B, A); Score (2196); E-value (0.0); начало и конец выравнивания во входной последовательности (Query) (1 - 424); начало и конец выравнивания в находке (Subject) (1 - 424). Первой в списке оказалась находка о цепи SYH_ECOLI.
Задание 2: поиск белка по его гомологу. Провести поиск в банке swissprot программой BLASTP, подав на вход последовательность из файла secondprot.fasta из практикума 7. В выдаче ваш белок? Мой белок найден: его порядковый номер в выдаче (5); процент совпадений (Identity) (348/424 (82%)); Score (1822); E-value (0.0); начало и конец выравнивания во входной последовательности (Query) (1 - 424); начало и конец выравнивания в находке (Subject) (1 - 424).
Первой в списке и находится последовательность белка SYH_YERPE (и SYH_YERPS), которую я ввел.

Задание 3: провести поиск в банке swissprot программой BLASTP, подав на вход последовательность из файла thirdprot.fasta. Занесите в протокол те же сведения: его порядковый номер в выдаче (8); процент совпадений (Identity) (10/10 (100%), 12/13 (92%)); Score (57, 56); E-value (16); начало и конец выравнивания во входной последовательности (Query) (1 - 10, 9 - 21); начало и конец выравнивания в находке (Subject) (120 - 129, 244 - 256).
Мой белок не первый в списке. Программа два раза учитывала 9-ую и 10-ую аминокислоты входной последовательности (следовало рассматривать 11 - 21 аминокислоты входной последовательности и 246 - 256 аминокислоты находки. Тогда процент совпадений во втором случае был бы равным 100% (11/11).

Задание 4: повторить одно из заданий, пользуясь программой BLASTP на сервере EBI и на сервере Пастеровского института. Результаты повторного выполнения задания 2: сервер EBI: значение Score дано не в битах (малозначимый недостаток); E-value отличается (неудивительно). Аминокислотные последовательности SYH_YERPS и SYH_YERPE полностью совпадают, здесь это показывается, как разные находки (плохо или хорошо — зависит от вкуса пользователя). сервер Пастеровского института: предлагается получить результаты по e-mail (оригинальность со своими плюсами и минусами — письмо с результатами пришло примерно через 5 минут).

Задание 5: c помощью программы BLASTP провести поиск по банку данных Swiss-Prot для репрессора рибозного оперона RbsR из организма Bacillus subtilis. Ортологами по заданию являются последовательности, в названии которых стоит слово RbsR. Следует проанализировать список первых 20 находок. Ортологи — последовательности, возникшие из одного общего предшественника в процессе видообразования. Ортологи, как правило, имеют одну и ту же функцию. Число ортологов RBSR_BACSU в списке первых 20 находок5. Является ли BLAST инструментом для поиска ортологов? Первые три гомолога с низкими E-Value - идут первыми в списке. Но этого очень мало. При этом программа может найти сходные, но не родственные последовательности (яркий пример аналогии), хотя в данном случае это скорее всего не так. Вообще, работа с более крупными группами белков в BLASTP может носить куда более трудоёмкий характер.
На главную страницу семестра


©Ларионов Дмитрий