|
|
-
Прогоним по Psi-BLAST следующие последовательности: (AC в SwissProt)
P18196, P0A832, P0A780; четвёртая P0A6X7(последовательность моего белка).
| ID белка |
AC белка |
Число итераций |
Для первой итерации |
Для последней итерации |
| Число находок выше порога (0,005) |
Худшее E-value выше порога |
Лучшее E-value ниже порога |
Число находок выше порога (0,005) |
Худшее E-value выше порога |
Лучшее E-value ниже порога |
| MINC_ECOLI |
P18196 |
5 |
124 |
0.004 |
0.006 |
233 |
0.002 |
0.008 |
| SSRP_ECOLI |
P0A832 |
2 |
449 |
1e-08 |
4.5 |
449 |
4e-32 |
0.28 |
| NUSB_ECOLI |
P0A780 |
4 |
325 |
0.003 |
0.007 |
388 |
1e-12 |
0.028 |
| IHFA_ECOLI |
P0A6X7 |
3 |
380 |
5e-04 |
0.011 |
387 |
2e-10 |
0.018 |
Далее скажу немного про каждое выравнивание.
- P18196. количество белков с E-value <0.005 по итерациям соответственно:124, 147, 148, 158, 233.
очень близок к исследуемому белку, один из первых в списке первой итерации: MINC_SALTI, e-value на каждой итерации: 6e-122, 2e-89, 3e-78, 2e-78, 5e-77.
белок из середины писка MINC_BURMA, e-value:4e-22, 2e-57, 2e-54, 6e-56, 2e-55.
белок с одним из самых больших допустимых e-value после первой итерации, внизу списка: MINC_BACWK, e-value^ 0.004, 3e-20, 6e-38, 5e-43, 7e-43.
После 5 итераций, так и не сошлась выборка белков. Причем в ходе итераций в планируемый профиль попали явно не относящиеся к этому типу белки.(что видимо и повлияло, дав в выборке представителей еще двух классов белков). Интересно, что в процессе итераций, значения E-value между гомологами сближаются. Так E-value MINC_SALTI увеличилось с 6e-122 до 5e-77. В то время как E-value MINC_BACWK упало с 0.004 до 7e-43. В то время как у находящегося после первой итерации где-то между ними MINC_BURMA только упало с 4e-22 до 2e-55, причем преимущественно это падение произошло на второй итерации.
- . P0A832 количество белков с E-value <0.005 по итерациям соответственно:449, 449.
белок с маленьким e-value SSRP_PHOLL, e-value на разных итерациях: 3e-76, 1e-71
белок с большим e-value SSRP_ARTAT, e-value: 5e-16, 1e-49
Выборка не расширилась после второй итерации. Но E-value, как и в предыдущем случае, естественно, изменилось в тех же направлениях. Правда E-value у близкого гомолога изменилось всего на 5 порядков, а у одного из последних в первоначальном списке – на целых 33 порядка. Как следствие подобных изменений сильно увеличился разрыв между предполагаемыми гомологами и негомологами – от 8 порядкоd до 30 порядков.
- P0A780 количество белков с E-value <0.005 по итерациям соответственно:325, 382, 388, 388
белок с маленьким e-value NUSB_PHOLL e-value на разных итерациях: 2e-50, 2e-45, 1e-44, 8e-44
белок с большим e-value NUSB_GRABC e-value на разных итерациях: 3e-05, 2e-29, 9e-30, 2e-29
Собственно на первой стадии уже видно левый белок RSMB_SYNY3 . он видимо дальше будет нам мешаться. Да, как и предполагалось, на второй стадии видим множество белков класса RSMB.
- P0A6X7 количество белков с E-value <0.005 по итерациям соответственно:380, 387, 387.
белок с маленьким e-value NUSB_PHOLL e-value на разных итерациях:IHFA_SALTY 1e-41, 3e-38, 4e-37
белок с большим e-value NUSB_GRABC e-value на разных итерациях:DBH_CHLPN 5e-04, 4e-21, 3e-20
Уже на первой опять же стадии выплывает много ненужных нам белков, таких как DBH и IHFB. На второй стадии добавляется еще два класса белков
- Что касается первой, несошедшейся последовательности, то при e-value < 0.001, итерации сошлись на третей. Хотя там в первом выравнивание были вроде не было белков из других классов, можно предположить, что туда попал очень странный белок, который содержит а себе какие-то участки, больше похожие на другой класс.
|