Практиум 10
1. Гомологи для белка PYRC_SALTY (база данных: Swiss-Prot)
При работе с BLAST я использовала следущие парметры:
- Окно для ввода последователности: P06204
- База данных: стандартная
- Банк: UniProtKB/Swiss-Prot
- Дополнительное поле для ограничения поиска: не использовала
- Алгоритм: blastp
- Параметеры алгоритма:
- максимальный размер выдачи: 250
- порог на E-value: 0.05
- параметры выравнивания: матрица:BLOSUM62
- стоимость штрафа за открытие и закрытие гэпов: открытие-11, закрытие-1
- Борьба с "участками малой сложности":
- Композиционные корректировки: условная компазиционная корректировка матрицы счета
- Фильтры и маски не были выбраны
итог: в параматерах алгоритма было изменено только максимальное количество последовательностей
Ниже представлены гиперссылки на результат работы программы BLAST и Jalview:
При выравнивании не было выявлено негомологичных белков.
2. Работа с вирусными белками.
При поиске вирусного белка, я воспользовалась программой UniProt. Ниже представлена информация о выбранном белке.
- ID: MAT_INCJJ
- AC: P12446
- OS: Influenza C virus (strain C/JJ/1950)
- CHAIN: Protein CM2
- CHAIN coordinates: 260..374
Ниже представлены гиперссылки на результат работы программы BLAST и Jalview:
3. Исследование зависимости E-value от объёма банка.
Таблица 1. Изменение значения E-value в заисимости от использования фильтра.
| АС белка |
Значение E-value при 1 запросе |
Значение E-value при 2 запросе |
| P12446.2 |
7е-80 |
3e-81 |
| O39842.2 |
4е-78 |
2e-79 |
| Q788J2.2 |
4e-78 |
2е-79 |
| Q6I7B9.2 |
5е-78 |
2е-79 |
| Q788J5.2 |
3е-77 |
1е-78 |
Исходя из данных таблицы 1, можно сказать.что E-value1 > E-value2 в 23.3 раза. Следовательно, предполагаемое количество вирусных белков в Swiss-Prot можно рассчитать по формуле:
569,213/23.3 = 24,429.