учебный сайт Вероники Владыкиной

Проекты. Пробное выравнивание

на главную
1 семестр
2 семестр
проекты
официальный сайт ФББ
  1. Прогоним по Psi-BLAST следующие последовательности: (AC в SwissProt) P18196, P0A832, P0A780; четвёртая P0A6X7(последовательность моего белка).
    ID белка AC белка Число итераций Для первой итерации Для последней итерации
    Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога
    MINC_ECOLI P18196 5 124 0.004 0.006 233 0.002 0.008
    SSRP_ECOLI P0A832 2 449 1e-08 4.5 449 4e-32 0.28
    NUSB_ECOLI P0A780 4 325 0.003 0.007 388 1e-12 0.028
    IHFA_ECOLI P0A6X7 3 380 5e-04 0.011 387 2e-10 0.018

    Далее скажу немного про каждое выравнивание.

    1. P18196. количество белков с E-value <0.005 по итерациям соответственно:124, 147, 148, 158, 233.
      очень близок к исследуемому белку, один из первых в списке первой итерации: MINC_SALTI, e-value на каждой итерации: 6e-122, 2e-89, 3e-78, 2e-78, 5e-77.
      белок из середины писка MINC_BURMA, e-value:4e-22, 2e-57, 2e-54, 6e-56, 2e-55.
      белок с одним из самых больших допустимых e-value после первой итерации, внизу списка: MINC_BACWK, e-value^ 0.004, 3e-20, 6e-38, 5e-43, 7e-43.
      После 5 итераций, так и не сошлась выборка белков. Причем в ходе итераций в планируемый профиль попали явно не относящиеся к этому типу белки.(что видимо и повлияло, дав в выборке представителей еще двух классов белков). Интересно, что в процессе итераций, значения E-value между гомологами сближаются. Так E-value MINC_SALTI увеличилось с 6e-122 до 5e-77. В то время как E-value MINC_BACWK упало с 0.004 до 7e-43. В то время как у находящегося после первой итерации где-то между ними MINC_BURMA только упало с 4e-22 до 2e-55, причем преимущественно это падение произошло на второй итерации.
    2. . P0A832 количество белков с E-value <0.005 по итерациям соответственно:449, 449.
      белок с маленьким e-value SSRP_PHOLL, e-value на разных итерациях: 3e-76, 1e-71
      белок с большим e-value SSRP_ARTAT, e-value: 5e-16, 1e-49
      Выборка не расширилась после второй итерации. Но E-value, как и в предыдущем случае, естественно, изменилось в тех же направлениях. Правда E-value у близкого гомолога изменилось всего на 5 порядков, а у одного из последних в первоначальном списке – на целых 33 порядка. Как следствие подобных изменений сильно увеличился разрыв между предполагаемыми гомологами и негомологами – от 8 порядкоd до 30 порядков.
    3. P0A780 количество белков с E-value <0.005 по итерациям соответственно:325, 382, 388, 388
      белок с маленьким e-value NUSB_PHOLL e-value на разных итерациях: 2e-50, 2e-45, 1e-44, 8e-44
      белок с большим e-value NUSB_GRABC e-value на разных итерациях: 3e-05, 2e-29, 9e-30, 2e-29 Собственно на первой стадии уже видно левый белок RSMB_SYNY3 . он видимо дальше будет нам мешаться. Да, как и предполагалось, на второй стадии видим множество белков класса RSMB.
    4. P0A6X7 количество белков с E-value <0.005 по итерациям соответственно:380, 387, 387. белок с маленьким e-value NUSB_PHOLL e-value на разных итерациях:IHFA_SALTY 1e-41, 3e-38, 4e-37 белок с большим e-value NUSB_GRABC e-value на разных итерациях:DBH_CHLPN 5e-04, 4e-21, 3e-20 Уже на первой опять же стадии выплывает много ненужных нам белков, таких как DBH и IHFB. На второй стадии добавляется еще два класса белков
  2. Что касается первой, несошедшейся последовательности, то при e-value < 0.001, итерации сошлись на третей. Хотя там в первом выравнивание были вроде не было белков из других классов, можно предположить, что туда попал очень странный белок, который содержит а себе какие-то участки, больше похожие на другой класс.
Владыкина 2008