Практикум 10

1. Гомологи исходного белка

Для выполнения задания я взяла белок, с которым уже работала ранее в 7 практикуме.

Для поиска гомологов фермента сирогемсинтазы (A0A3R8W1N3_PRORE) из бактерии Providencia rettgeri были использованы следующие параметры запуска BLAST:

Текстовая выдача

Для множественного выравнивания были выбраны следующие 7 гомологов:

  1. B3GZA0.1 Actinobacillus pleuropneumoniae serovar 7 str. AP76
  2. Q2NVN0.1 Sodalis glossinidius str. 'morsitans'
  3. Q66EC9.1 Yersinia pseudotuberculosis IP 32953
  4. A7MJ67.1 Cronobacter sakazakii ATCC BAA-894
  5. B0BTC2.1 Actinobacillus pleuropneumoniae serovar 3 str. JL03
  6. Q7N8L2.1 Photorhabdus laumondii subsp. laumondii TTO1
  7. A0A3R8W1N3_PRORE Providencia rettgeri

Ссылка на скачивание множественного выравнивания гомологов с исходной последовательностью A0A3R8W1N3_PRORE Providencia rettgeri.

Выравнивание имеет достаточно высокий вес, а последовательности содержат внушительное количество общих консервативных участков, поэтому можно смело говорить о гомологичности выбранных белков.

2. Гомологи вирусного белка

Вирусный полипротеин:

Зрелый белок:

После запуска поиска в BLAST получила 3 последовательности, изменение параметра 'Word size' на результат не повлияло.

  1. Crimean-Congo hemorrhagic fever virus strain IbAr10200
  2. Dugbe virus (isolate ArD44313)
  3. Hazara virus (isolate JC280)

Полученное выравнивание можно скачать по ссылке.

Все последовательности скорее всего являются гомологами, поскольку по всей их длине расположено большое количество консервативных участков.

3. Исследование E-value

Поскольку я выбрала белок слишком малоизвестного вируса, то находок в NCBI было всего три и каждая вирусного происхождения, поэтому при применении фильтра по организмам ничего не меняется. Могу предположить, что при использовании фильтра количество находок должно было бы сократиться.

Чтобы оценить долю вирусных белков в Swiss-Prot путём сравнения значений E-value, можно вспомнить, что суммарная длина последовательностей базы данных ~ Е-value, следовательно:

E-valuе (вирусы)/E-valuе (без учёта таксона) = доля вирусных последовательностей в Swiss-Prot.