Задание №1.Поиск гипотетических гомологов изучаемого белка в разных банках данных
Таблица 1. Результаты поиска гипотетических гомологов белка MANA3_BACSU
Поиск по БД Swiss-Prot | Поиск по БД PDB | Поиск по БД "nr" | |
1. Лучшая находка (в принципе должна соответствовать заданному белку) | |||
Accession | P39841.1 | 1QWR_A | NP_391460.1 |
E-value | 0.0 | 0.0 | 0.0 |
Вес (в битах) | 656 | 647 | 656 |
Процент идентичности | 100% | 99% | 100% |
Найдены ли другие белки с теми же значениями E-value и веса в битах? Если найдены, то укажите общее число и приведите один идентификатор (любой, но желательно Swiss-Prot ID) |
Не найдены | Не найдены | Найдены еще 3 белка со значением E-value=0.0, но они имеют другой вес (в битах).Идентификатор одного из них - YP_004205410 |
2. Сколько хороших кандидатов в гомологи найдено? (число находок в списке описаний с E-value < 1E-10) | 4 | 2 | 792 |
3. "Худшая из хороших" находка (последняя в выдаче с E-value < 1) | |||
Номер находки в списке описаний | 13 | 5 | 1129, но, так как последнее, выведенное выравнивание с данным не совпадает, дальше будут данные про него. Кстати, его номер - 1000 |
Accession | Q8HXX2.3 | 2PHD_A | ZP_07637994.1 |
E-value | 0.67 | 0.90 | 0.12 |
Вес (в битах) | 35.0 | 30.8 | 42.0 |
% идентичности | 30% | 36% | 33% |
% сходства | 48% | 64% | 45% |
Длина выравнивания | 73 | 33 | 101 |
Координаты выравнивания (от-до, в запросе и в находке) | В запросе: 36-104 В находке: 47-118 |
В запросе: 269-301 В находке: 302-334 |
В запросе: 11-104 В находке: 24-123 |
Число гэпов | 5 | 0 | 8 |
- Исходный белок удалось найти в SwissProt и nr, а вот в PDB первая строка в поиске - уже не исходный белок
- При поиске в разных базах данных я получила разное количество хороших кандидатов в гомологи. Возможно, это случилось потому, что размер этих баз данных различен ( что было видно исходя и из количества выведенных результатов).
- nr:
Количество находок - 1284,
E_value самой последней - 9.9
pdb:
Количество находок - 17,
E_value самой последней - 9.7
swissprot:
Количество находок - 27,
E_value самой последней - 9.4
Во всех случаях число находок было ограничено значением E_value, однако выравниваний в nr было только 1000.
