Работа с программой BLAST
Цель задания - знакомство с программой BLASTP.
Задание 1: провести поиск своей последовательности программой BLASTP.
a) провести поиск своей последовательности программой BLASTP в банке swissprot.
В выдаче программы отыскать мой белок и занести в протокол:
его порядковый номер в выдаче (1);
Score (2196);
E-value (0.0);
б) повторить поиск с той же входной последовательностью, указав в качестве банка pdb. Для первой в списке находки указать: PDB-коды и идентификаторы цепей, Score, E-value, начало и конец выравнивания во входной последовательности (Query) и в находке (Subject), процент совпадений (Identity).
PDB-коды (1KMN, 1KMM);
идентификаторы цепей (D, C, B, A);
Score (2196);
E-value (0.0);
начало и конец выравнивания во входной последовательности (Query) (1 - 424);
начало и конец выравнивания в находке (Subject) (1 - 424).
Первой в списке оказалась находка о цепи SYH_ECOLI.
Задание 2: поиск белка по его гомологу. Провести поиск в банке swissprot программой BLASTP, подав на вход последовательность из файла secondprot.fasta из практикума 7. В выдаче ваш белок? Мой белок найден:
его порядковый номер в выдаче (5);
процент совпадений (Identity) (348/424 (82%));
Score (1822);
E-value (0.0);
начало и конец выравнивания во входной последовательности (Query) (1 - 424);
начало и конец выравнивания в находке (Subject) (1 - 424).
Первой в списке и находится последовательность белка SYH_YERPE (и SYH_YERPS), которую я ввел.
Задание 3: провести поиск в банке swissprot программой BLASTP, подав на вход последовательность из файла thirdprot.fasta. Занесите в протокол те же сведения:
его порядковый номер в выдаче (8);
процент совпадений (Identity) (10/10 (100%), 12/13 (92%));
Score (57, 56);
E-value (16);
начало и конец выравнивания во входной последовательности (Query) (1 - 10, 9 - 21);
начало и конец выравнивания в находке (Subject) (120 - 129, 244 - 256).
Мой белок не первый в списке. Программа два раза учитывала 9-ую и 10-ую аминокислоты входной последовательности (следовало рассматривать 11 - 21 аминокислоты входной последовательности и 246 - 256 аминокислоты находки. Тогда процент совпадений во втором случае был бы равным 100% (11/11).
Задание 4: повторить одно из заданий, пользуясь программой BLASTP на сервере EBI и на сервере Пастеровского института.
Результаты повторного выполнения задания 2:
сервер EBI: значение Score дано не в битах (малозначимый недостаток); E-value отличается (неудивительно). Аминокислотные последовательности SYH_YERPS и SYH_YERPE полностью совпадают, здесь это показывается, как разные находки (плохо или хорошо зависит от вкуса пользователя).
сервер Пастеровского института: предлагается получить результаты по e-mail (оригинальность со своими плюсами и минусами письмо с результатами пришло примерно через 5 минут).
Задание 5: c помощью программы BLASTP провести поиск по банку данных Swiss-Prot для репрессора рибозного оперона RbsR из организма Bacillus subtilis. Ортологами по заданию являются последовательности, в названии которых стоит слово RbsR. Следует проанализировать список первых 20 находок.
Ортологи последовательности, возникшие из одного общего предшественника в процессе видообразования. Ортологи, как правило, имеют одну и ту же функцию.
Число ортологов RBSR_BACSU в списке первых 20 находок 5. Является ли BLAST инструментом для поиска ортологов? Первые три гомолога с низкими E-Value - идут первыми в списке. Но этого очень мало. При этом программа может найти сходные, но не родственные последовательности (яркий пример аналогии), хотя в данном случае это скорее всего не так. Вообще, работа с более крупными группами белков в BLASTP может носить куда более трудоёмкий характер.