Учебный сайт Фоменко Елены
Главная | Семестры | Проекты | Заметки |
1. Таблица результатов поиска гипотетических гомологов белка YSDC_BACSU:
Поиск по Swiss-Prot | Поиск по PDB | Поиск по "nr" | |
1. Лучшая находка |
|||
Accession | PЗ94521.1 | 1VHE A | NP_390760.1 |
E-value | 0.0 | 0.0 | 0.0 |
Вес (в битах) | 738 | 708 | 738 |
Процент идентичности | 100% | 96% | 100% |
2. Сколько хороших кандидатов в гомологи найдено? (число находок в списке описаний с E-value < 1e-10) |
|||
13 | 13 | 546 | |
3. "Худшая из удовлетворительных" находка (последняя в выдаче с E-value < 1) |
|||
Номер находки в списке описаний | 19 | 23 | 834 |
Accession | B6IPC7 | 1BWW A | ZP 04229557.1 |
E-value | 0.022 | 0.88 | 0.96 |
Вес (в битах) | 39.7 | 30.0 | 26.2 |
% идентичности | 33% | 33% | 21% |
% сходства | 49% | 53% | 54% |
Длина выравнивания | 75 | 49 | 57 |
Координаты выравнивания (от-до, в запросе и в находке) | 37-111, 44-112 | 253-301, 39-72 | 296-352, 318-372 |
Число гэпов | 6 | 15 | 2 |
Что странно: 1VHE – это PDB ID моего же белка, но при поиске гомологов в этом банке получила результаты выравнивания, отличные от других. Возможно, в PDB хранятся неправильные данные о моем белке?... При поиске в nr пришлось ввести ограничения по таксону: Bacillales (taxid:1385). Во всех трех банках мой белок был найден. Структура в PDB тоже нашлась. Различия в количестве находок обусловлены различной полнотой данных и количеством источников данных. В nr собраны все известные последовательности из множества банков. Потому, если не убрать ограничение в 100 результатов, то не получится дойти до значения E-value>0. Это будет также очень затруднительно сделать, если не ограничить таксон.
2. Ищу гомологи белка в филогенетически далеких таксонах. Нашелся "гомолог" из организма человека (Eukaryota (taxid:2759)).
Номер находки в списке описаний | 1 |
Accession | P01608.1 |
E-value | 2e-04 |
Вес (в битах) | 32.7 |
% идентичности | 37% |
% сходства | 51% |
Длина выравнивания | 49 |
Координаты выравнивания (от-до, в запросе и в находке) | 253-301, 37-70 |
Число гэпов | 15 |
3. Командой needle sw:p94521 sw:p01608 YSDC_BACSU,KV116_HUMAN.needle получила оптимальное полное выравнивание:
Aligned_sequences: 2 # 1: YSDC_BACSU # 2: KV116_HUMAN # Matrix: EBLOSUM62 # Gap_penalty: 11.0 # Extend_penalty: 1.0 # # Length: 368 # Identity: 33/368 ( 9.0%) # Similarity: 47/368 (12.8%) # Gaps: 267/368 (72.6%) # Score: 30.0 # # #======================================= YSDC_BACSU 1 MAKLDETLTMLKDLTDAKGIPGNEREVRQVMKSYIEPFADEVTTDRLGSL 50 KV116_HUMAN 0 -------------------------------------------------- 0 YSDC_BACSU 51 IAKKTGAENGPKIMIAGHLDEVGFMVTQITDKGFIRFQTVGGWWAQVMLA 100 KV116_HUMAN 0 -------------------------------------------------- 0 YSDC_BACSU 101 QRVTIVTKKGEITGVIGSKPPHILSPEARKKSVEIKDMFIDIGASSREEA 150 KV116_HUMAN 0 -------------------------------------------------- 0 YSDC_BACSU 151 LEWGVLPGDMIVPHFEFTVMNNEKFLLAKAWDNRIGCAIAIDVLRNLQNT 200 KV116_HUMAN 0 -------------------------------------------------- 0 YSDC_BACSU 201 DHPNIVYGVGTVQEEVGLRGAKTAAHTIQPDIAFGVDVG-------IAGD 243 .....|...:....|| .|.. KV116_HUMAN 1 -----------------------DIQMTQSPSSLSASVGDRVTITCQASQ 27 YSDC_BACSU 244 TPGISEKEAQSKMGKGPQIIVYDASMVSHKGLRDAVVATAEEAGIPYQFD 293 ...|.....|.|.||.|::::||||.: |||:|.:|. KV116_HUMAN 28 DISIFLNWYQQKPGKAPKLLIYDASKL--------------EAGVPSRFS 63 YSDC_BACSU 294 AIAGGGTDSGAIHLTANGVPALSITIATRYIHTHAAMLHRDDYENAVKLI 343 . .|.||| ...|.:.:.... |||.|. ..::| :.|. KV116_HUMAN 64 G-TGSGTD---FTFTISSLQPED--IATYYC---------QQFDN-LPLT 97 YSDC_BACSU 344 TEVIKKLDRKTVDEITYQ 361 .....|:|.|. KV116_HUMAN 98 FGGGTKVDFKR------- 108 #--------------------------------------- #---------------------------------------
Командой water sw:p94521 sw:p01608 YSDC_BACSU,KV116_HUMAN.water получила оптимальное частичное выравнивание:
# Aligned_sequences: 2 # 1: YSDC_BACSU # 2: KV116_HUMAN # Matrix: EBLOSUM62 # Gap_penalty: 11.0 # Extend_penalty: 1.0 # # Length: 49 # Identity: 18/49 (36.7%) # Similarity: 25/49 (51.0%) # Gaps: 15/49 (30.6%) # Score: 73.0 # # #======================================= YSDC_BACSU 253 QSKMGKGPQIIVYDASMVSHKGLRDAVVATAEEAGIPYQFDAIAGGGTD 301 |.|.||.|::::||||.: |||:|.:|.. .|.||| KV116_HUMAN 37 QQKPGKAPKLLIYDASKL--------------EAGVPSRFSG-TGSGTD 70 #--------------------------------------- #---------------------------------------
Для этих выравниваний установила штраф за открытие пробела 11, за продолжение пробела – 1 (как в BLASTp).
А вот выравнивание из предыдущего задания:
Сравним выравнивание из задания 2 с оптимальным полным выравниванием. Координаты последовательностей в выбранном фрагменте (присутствующем в обоих выравниваниях): 253-301 для запроса и 37-70 для находки.
Меры совпадения для первого и второго равны 100%, выравнивания на этом фрагменте совершенно одинаковы.
Вес всего полного выравнивания=30,а вес выравнивания BLASTp = 73, т.к. полное выравнивание очень невыгодно в этом плане: много пробелов. Длина глобального выравнивания = 368, длина выравнивания BLASTp = 49.
Сравним оптимальное частичное выравнивание и выравнивание BLASTp. Можно сказать только то, что они совершенно одинаковы.