8 (926) 907 94 08 Здесь должен быть мальчик с мензуркой!
Всё на свете является чудом!

 

PSI-BLAST 


1.
Итеративный поиск программой PSI-BLAST


Для выполнения задания зашли на сайт, где есть необходимый сервис итеративного поиска. Затем выполнили поиск каждой аминокислотной последовательности, внося соответствующие AC в верхнее окошко. При этом учли следующие параметры:

- в разделе "Database" выбрать Swissprot
- в разделе "Algorithm" выбрать PSI-BLAST
- в разделе "Max target sequences" изменить значение с 500 на 5000
- E-value оставить равным 0,005

MINC_ECOLI:

- Идёт увеличение числа находок от итерации к итерации: на первой было 165, на второй - 190, на третьей - 204, на четвёртой - 439, а на пятой уже 995.

- Разница между значениями E-value худшей находки выше порога и лучшей находки ниже порога сначала растёт от итерации к итерации: первая итерация - (0,005 — 0.004), вторая итерация - (0.066 — 0.005), но потом, на третьей итерации, уменьшается - (0.006 — 0.004), на четвёртой итерации нет никаких различий в значении E-value с точностью до третьего знака после запятой (0.005), а на пятой итерации разрыв опять начинает расти (0.023 — 7e-04).

- E-value лучшей находки увеличивается: 8e-171 на первой итерации, 1e-117 - на второй, 1e-100 - на третьей, 6e-97 - на четвёртой и 1e-83 - на пятой.

- Проследив за E-value "средней" находки, например, белка MINC_BURCA (AC Q1BY89), заметим, что происходит уменьшение значения: первая итерация - 4e-29, вторая итерация - 3e-72.

- От итерации к итерации появляются новые последовательности и даже после пяти итераций список не "стабилизировался", но для последующих итераций новых находок не появилось.

- Можно отметить сходимость результатов поиска.

SSRP_ECOLI:

- Никаких изменений числа находок от итерации к итерации не происходит.

- Разница между значениями E-value худшей находки выше порога и лучшей находки ниже порога от итерации к итерации увеличивается: первая итерация - (4.9 — 3e-12), вторая итерация - (0.42 — 3e-38).

- E-value лучшей находки увеличивается: 3e-116 на первой итерации, 2e-94 - на второй.

- Проследив за E-value "средней" находки, например, белка SSRP_OCEIH (AC Q8ENQ2), заметим, что происходит уменьшение значения: первая итерация - 1e-37, вторая итерация - 2e-77

- От итерации к итерации не появляется никаких новых последовательностей. Список "стабилизировался" после двух итераций, так как уже на второй итерации не нашлось новых последовательностей выше заданного порога.

- Можно отметить сходимость результатов поиска.

Y380_RHIME:

- Идёт увеличение числа находок от итерации к итерации: на первой было 15, на второй - 24, на третьей - 25, а на четвёртой и последующих итерациях число находок не меняется.

- Разница между значениями E-value худшей находки выше порога и лучшей находки ниже порога от итерации к итерации увеличивается: первая итерация - (0.027 — 7e-04), вторая итерация - (0.011 — 5e-09), третья итерация - (0.012 — 0.002) и четвёртая итерация - (0.024 — 3e-18).

- E-value лучшей находки увеличивается: 7e-141 на первой итерации, 1e-77 - на второй, 2e-75 - на третьей и 1e-71 - на четвертой.

- Проследив за E-value "средней" находки, например, белка Y1082_DEIRA (AC Q9RVE7), заметим, что происходит уменьшение значения: первая итерация - 2e-06, вторая итерация 1e-54, третья итерация 1e-62, а затем увеличение на четвёртой итерации - 2e-60.

- От итерации к итерации не появляется никаких новых последовательностей. Список "стабилизировался" после четырёх итераций, так как уже на четвёртой итерации не нашлось новых последовательностей выше заданного порога.

- Можно отметить сходимость результатов поиска.

THIS_BACSU:

- Идёт увеличение числа находок от итерации к итерации: на первой было 5, на второй - 8, а на третьей и последующих итерациях число находок не меняется.

- Разница между значениями E-value худшей находки выше порога и лучшей находки ниже порога от итерации к
итерации увеличивается: первая итерация - (0.007 — 0,002), вторая итерация - (3,0 — 0,004).

- E-value лучшей находки увеличивается: 1e-40 на первой итерации, 5e-22 - на второй и 2e-20 - на третьей.

- Проследив за E-value "средней" находки, например, белка YCF40_ODOSI (AC P49535), заметим, что происходит
уменьшение значения: первая итерация - 2e-04, вторая итерация 6E-18, третья итерация 5e-18.

- От итерации к итерации не появляется никаких новых последовательностей. Список "стабилизировался" после
трёх итераций, так как уже на третьей итерации не нашлось новых последовательностей выше заданного
порога.

- Можно отметить сходимость результатов поиска.

На основе полученных результатов заполнили таблицу:

ID белка

AC белка

Число итераций

Для первой итерации

Для последней итерации

Число находок выше порога

(0,005)

Худшее E-value выше порога

Лучшее E-value ниже порога

Число находок выше порога

(0,005)

Худшее E-value выше порога

Лучшее E-value ниже порога

MINC_ECOLI

P18196

5

165

0.004

0.005

995

7e-04

0.023

SSRP_ECOLI

P0A832

2

514

3e-12

4.9

514

3e-38

0.42

Y380_RHIME

P17265

4

15

7e-04

0.027

25

3e-18

0.024

THIS_BACSU

O31617

3

5

0.002

0.007

8

9e-05

1.8


2. Поиск с изменённым значением порога на E-value

- Для последовательности первого белка MINC_ECOLI (AC P18196), изменив порог на E-value с 0.005 на 0.001, проведём очередной поиск.

- На первой итерации мы видим 157 находок выше порога, худшая из которых имеет значение E-value, равное 0.001. Лучшая находка ниже порога имеет значение 0.001.

- На второй итерации мы видим 188 находок выше порога, худшая из которых имеет значение E-value, равное 8e-08. Лучшая находка ниже порога имеет значение 0.003. Разрыв между указанными значениями заметно увеличился.

- Затем на третьей итерации число находок выше порога не изменилось. Новых последовательностей выше заданного порога найдено не было. Худшая находка ниже порога имеет значение E-value, равное 4e-12, лучшая находка ниже порога - 0.001, так что список "стабилизировался" ещё на второй итерации.

- Таким образом, при повторном поиске мы сделали фильтрацию результатов более "строгой", уменьшив значение E-value, что привело к сходимости результатов поиска.

- Максимальное значение порога равно 0.0010 с точностью до четвёртого знака (уже при пороге 0.0011 выше порога оказывается последовательность белка FRMA_PASPI (AC P39450), что затем приводит к расходимости результатов).
Главная
Об авторе
Учебные семестры
Проекты автора
Друзья
Ссылки партнеров
Extra
Контакты


Главная Об авторе Учебные семестры Проекты автора Друзья Ссылки партнеров Extra Контакты

Mneff © 2011-2012