WELCOME MY FRIEND!


PSI-BLAST

  1. Провела работу с четырьмя аминокислотными последовательностями. Первые три последовательности имеют в Swiss-Prot номера доступа P18196, P0A832, P0A780; четвёртая - P29208 - последовательность моего белка.

    Для этих последовательностей провела итеративный поиск по банку Swiss-Prot программой PSI-BLAST. Выполняем до пяти итераций, пока появляются новые последовательности выше порога 0,005 на E-value; если же и после пятой итерации список не стабилизировался, можно на этом остановиться.

    ID белка AC белка Число итераций Для первой итерации Для последней итерации
    Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога
    MINC_ECOLI P18196 5 126 0.004 0.005 239 0.003 0.007
    SSRP_ECOLI P0A832 2 449 3e-10 5.0 449 8e-31 0.62
    NUSB_ECOLI P0A780 4 327 0.003 0.008 388 2e-12 0.031
    MENC_ECOLI P29208 5 362 0.005 0.005 362 0.005 0.005

    Итерации для каждой последовательности ведут себя по-разному. Так, например, для первой последовательности количество находок выше порога E-value в 0.005 увеличивается почти в два раза после 5 итерации по сравнению с первой, для второй не изменяется после второй итерации, для третьей - увеличивается после четвёртой не так заметно, как для первой и , наконец, для последовательности моего белка после пяти итераций не изменяется. О разрыве между значениями E-value на границе порога 0.005 тоже нельзя судить однозначно. Так, для первой, третьей и четвёртой - моей последовательности - в первой итерации он не выходит за пределы порядка или даже не изменяется, то же можно сказать и для первой и четвертой последовательности в последней итерации. Однако для второй последовательности в первой итерации, а также для второй и третьей последовательностей в последних итерациях этот разрыв достигает нескольких порядков. Особенно наглядно это можно проследить по второй последовательности во второй итерации. Сходимости удаётся достичь далеко не всегда. Так, для второй последовательности она достигается уже на второй итерации. Для первой же последовательности и последовательности моего белка её не удаётся достичь и на пятой.

     
    Можно сделать вывод о том, что при достижении сходимости итераций разрыв с каждой итерацией растёт. Если же сходимость не достигается, мы остаёмся приблизительно на тех же значениях разрыва.

  2. Для первой последовательности провела поиск снова, изменив порог с 0,005 на 0,001.
    ID белка AC белка Число итераций Для первой итерации Для последней итерации
    Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога
    MINC_ECOLI P18196 3 120 9e-04 0.001 147 7e-10 0.002

    Как видим, удалось добиться схождения за 3 итерации, чего в первом случае не удалось достичь и после пяти. Максимальное значение порога, после которого итрерации будут сходиться, видимо, равно 0.001. это происходит из-за того. Что с большим значением порога увеличивается вероятность захвата "посторонних" белков.



К блоку
Ко 2му семестру
На главную



© Шишкова Настя, 2008