Учебный сайт Юдиной А.С.

Главная

Обо мне

Семестры

PSI-BLAST. Банк Prosite.

PSI-BLAST

Проводили несколько раундов поиска в psi-blast по AC P74518. Он соответствует белку Ribosome hibernation promotion factor, функция которого димеризовать способные к трансляции 70 S рибосомы в транскрипционно неактивные 100 S рибосомы. Данный белок встречается у рода Synechocystis, относящемуся к цианобактериям. Результаты каждой итерации добавлены в таблицу 1.

Таблица 1

Число находок выше порога (0.005) AC худшей находки E-value худшей находки AC лучшей находки ниже порога E-value лучшей находки ниже порога
1 24 P33987.1 (Ribosome hibernation promoting factor) 3e-05 Q65SX3.1 (Arginine--tRNA ligase) 4.8
2 28 P9WMA8.1 (Dormancy associated translati 3e-06 Q5K2N3.3 (Keratin, type II cytoskeletal 8) 0.15
3 28 P24694.1 (Ribosome hibernation promoting factor) 2e-20 Q0BSD5.2 (Alanine--tRNA ligase) 0.064

При последних двух итерациях число находок не изменилось, однако поменялся их порядок. Худшая находка в итерации 2 при итерации 3 оказалась 4 с конца, а худшая находка в итерации 3 при итерации 2 была третьей с конца.
Тем не менее, разрыв в E-value между худшей находкой над порогом и лучшей под порогом остается большим - порядка e-18. Поэтому можно сделать вывод, что найденные белковые последовательности составляют семейство гомологичных белков.

Prosite

Для работы с базой данных паттернов были выбраны бактерии из практикума 2, но были взяты последовательности белка фактора элонгации Ts (EFTS), так как для ранее рассматриваемого триггер-фактора (TIG) паттернов найдено не было.

В семействе Elongation factor Ts в Prosite было найдено два паттерна:

  1. [ELAS]-[LIVMF]-[NVCKGST]-[SCVA]-[QE]-T-D-[FS]-[VLA]-[SAT]-[KRNLAQS]
  2. L-R-x(2)-[ST]-[GSDNQ]-x-[GSA]-[LIVMF]-x(0,1)-[DENKAC]-x-K-[KRNEQS]-[AV]-L
Рис.1 Далее рассматривался паттерн 1, он был найден в варавнивании, открытом в программе Jalview, и сделан более строгим:
E-[VML]-N-[CS]-[EQ]-T-D-F-[VL]-A-[RKL] (Рис.1).

По более строгому паттерну в Prosite был найден список AC белков, содержащих данный паттерн (поиск по Swissprot) - 471 белок.
Далее на сайте Uniprot были найдены белки EFTS, относящиеся к протеобактеиям - это правильный список (то есть у всех этих последовательностей предполагается наличие данного паттерна) - 416 белок.

С помощью функции VLOOKUP в программе Excel было найдено пересечение полученных списков последовательностей:

True positives (пересечение множеств): 292
False positives (нашлись только в Prosite): 179
False negatives (содержатся только в правильном списке): 124

Ссылки:

Prosite
Uniprot


© Юдина Анастасия, 2016