Результаты поиска гипотетических гомологов белка GUAD_BACSU
Поиск по Swiss-Prot | Поиск по PDB | Поиск по "nr" | |
1. Лучшая находка (в принципе должна соответствовать заданному белку) | |||
Accession | O67050.1 | 1WWR_A | AEP90450 |
E-value | 2e-19 | 3e-20 | 4e-110 |
Вес (в битах) | 84.3 bits | 84.0 bits | 320 bits |
Процент идентичности | 44/102 (43%) | 47/116 (41%) | 152/156 (97%) |
2. Сколько хороших кандидатов в гомологи найдено? (число находок в списке описаний с E-value < 1e-10) | 20 | 8 | 96 |
3. "Худшая из удовлетворительных" находка (последняя в выдаче с E-value < 1) | |||
Номер находки в списке описаний | 22 | 9 | 100 |
Accession | O59834.1 | 2G84_A | ZP_08670073 |
E-value | 5e-10 | 2e-12 | 1e-48 |
Вес (в битах) | 58.2 bits | 62.4 bits | 164 bits |
% идентичности | 31/96 (32%) | 37/100 (37%) | 77/156 (49%) |
% сходства | 48/96 (50%) | 49/100 (49%) | 100/156 (64%) |
Длина выравнивания | 162 | 197 | 155 |
Координаты выравнивания (от-до, в запросе и в находке) | запрос: 6-101 находка: 13-105 |
запрос: 23-115 находка: 47-146 |
запрос: 1-156 находка: 1-155 |
Число гэпов | 3/96 (3%) | 7/100 (7%) | 1/156 (1%) |
Краткие комментарии к таблице:
- При поиске во всех трех БД сам белок GUAD_BACSU тоже выдавался в списке находок. Причем (что неудивительно) % идентичности равен 100%, кроме тех записей, которые представляют собой X-ray structure (identities 99%).
- Cравните число явных гомологов (E-value < 1e-10) при поиске по разным БД и поясните возможные причины различий; Но число явных гомологов определяется значением E-value: гомолог считается явным, если его E-value < 1e-10. Поэтому число именно "хороших" результатов при поиске по разным БД различается. Больше всего таковых при поиске по nr (т.е. при невыбранной отпределенной БД, когда BLAST ищет по всем, по которым может), т.к. баз много и нашлось гомологичных записей много. При поиске по PDB и SW "хороших" находок меньше (8 и 20 соответственно), и самые большие значения E-value (т.е. самые последние) 2e-12(PDB) и 5e-10 (SW). Это можно объяснить разным объемом содержащихся в базах записей о белках.
- По умолчанию предельный размер выдачи - 100 результатов. При поиске по nr число находок было лимитировано только заданным по умолчанию предельным размером выдачи. Это видно, потому что у самой последней E-value гораздо < 1 (1e-48). А вот при поиске по SW и PDB число находок явно было ограничено значением E-value: самое последнее 7.3 (PDB) и 7.5 (SW).
Printscreen таблицы выданных результатов при поиске по SW. Первая запись - мой белок.

Printscreen таблицы выданных результатов при поиске по PDB. Первые две записи - crystal и X-ray структуры моего белка.

Printscreen таблицы выданных результатов при поиске по NR. Первая и третья записи - мой белок. Вторая и четвертая - crystal и X-ray структуры моего белка.

Поиск гипотетических гомологов изучаемого белка с фильтром по таксонам
Номер находки в списке описаний | 1 |
Accession | Q9S7I0.1 |
E-value | 3e-20 |
Вес (в битах) | 81.3 bits |
% идентичности | 43/99 (43%) |
% сходства | 57/99 (58%) |
Длина выравнивания | 1307 |
Координаты выравнивания (от-до, в запросе и в находке) | запрос: 4-102 находка: 1111-1208 |
Число гэпов | 1/99 (1%) |
Сравнение выравниваний, выданных программой BLASTP, с оптимальными глобальным и локальным выравниваниями.
Для выравниваний были использованы следущие параметры:
Gap_penalty: 11.0
Extend_penalty: 1.0
Maatrix: BLOSUM62
Выранивание, полученное программой BLAST:
>sp|Q9S7I0.1|TADA_ARATH RecName: Full=tRNA-specific adenosine deaminase, chloroplastic; Short=TADA; Flags: Precursor Length=1307 GENE ID: 843202 TADA | tRNA-specific adenosine deaminase [Arabidopsis thaliana] (10 or fewer PubMed links) Score = 81.3 bits (199), Expect = 3e-20, Method: Composition-based stats. Identities = 43/99 (43%), Positives = 57/99 (58%), Gaps = 1/99 (1%) Query 4 ETFLKRAVTLACEGVNAGIGGPFGAVIVKDGAIIAEGQNNVTTSNDPTAHAEVTAIRKAC 63 E F++ A+ A + + P GAV+V DG IIA G N V D TAHAE+ IR+ Sbjct 1111 EIFMREALVEAKKAADTW-EVPVGAVLVHDGKIIARGYNLVEELRDSTAHAEMICIREGS 1169 Query 64 KVLGAYQLDDCILYTSCEPCPMCLGAIYWARPKAVFYAA 102 K L +++L D LY + EPCPMC GAI AR + + A Sbjct 1170 KALRSWRLADTTLYVTLEPCPMCAGAILQARVNTLVWGA 1208Выранивание, построенное программой needle (команда needle sw:guad_bacsu sw:TADA_ARATH needle.needle):
# Aligned_sequences: 2 # 1: GUAD_BACSU # 2: TADA_ARATH # Matrix: EBLOSUM62 # Gap_penalty: 11.0 # Extend_penalty: 1.0 # # Length: 1311 # Identity: 55/1311 ( 4.2%) # Similarity: 76/1311 ( 5.8%) # Gaps: 1159/1311 (88.4%) # Score: 167.0 # #======================================= GUAD_BACSU 0 -------------------------------------------------- 0 TADA_ARATH 1 MFNTYTNSLQWPIRSRNQQDYCSLLPERSESYKLSKAYTSSRCYCVSSRS 50 GUAD_BACSU 0 -------------------------------------------------- 0 TADA_ARATH 51 SCCCCCSTPSSSSFVKPKVLINPGFVLYGVRQSTLIQWPSFQRRLLVGGG 100 GUAD_BACSU 0 -------------------------------------------------- 0 TADA_ARATH 101 RLMGCEVYSSCDGIRRKNRSFKLRCLEESDECCGGRSCSDDVEAMISFLS 150 GUAD_BACSU 0 -------------------------------------------------- 0 TADA_ARATH 151 EELIDEERKWNLVSRVKEKKKVGNVRKVSVEGSNSYGNGRVSQRVKKPEG 200 GUAD_BACSU 0 -------------------------------------------------- 0 TADA_ARATH 201 FGRRKEIKEDVKLNERYDCEHCGRRKKSSELESESRRGSKLVTGEYIGKS 250 GUAD_BACSU 0 -------------------------------------------------- 0 TADA_ARATH 251 YRGDEEREVRPRRRKSSSCSSYYSLASSGEFESDTEDQEEDVEIYRENVR 300 GUAD_BACSU 0 -------------------------------------------------- 0 TADA_ARATH 301 SSEKKVVDQSAKRLKSRKEASQMHSRKKRDESSTGVDSRYQKQIFEEGEN 350 GUAD_BACSU 0 -------------------------------------------------- 0 TADA_ARATH 351 SNQAVTLNQRRRKKFSQTENRVSESTGNYEEDMEIHEVHVNDAETSSQNQ 400 GUAD_BACSU 0 -------------------------------------------------- 0 TADA_ARATH 401 KLFNEREDYRVHSIRNDSGNENIESSQHQLKERLETRYSSEDRVSEMRRR 450 GUAD_BACSU 0 -------------------------------------------------- 0 TADA_ARATH 451 TKYSSSQEEGINVLQNFPEVTNNQQPLVEERISKQAGTRRTTEHISESSE 500 GUAD_BACSU 0 -------------------------------------------------- 0 TADA_ARATH 501 IHDIDIRNTYVSQREDQIRNQEVHAGLVSGLQSERKQQDYHIEHNPLQTT 550 GUAD_BACSU 0 -------------------------------------------------- 0 TADA_ARATH 551 QSDRTSVSVSHTSDAVRYTEIQRKSEKRLIGQGSTTAVQSDSKVEKNGAQ 600 GUAD_BACSU 0 -------------------------------------------------- 0 TADA_ARATH 601 KEDSRLDHANSKKDGQTTLGLQSYQSKLSEEASSSQSSLMASRTKLQLVD 650 GUAD_BACSU 0 -------------------------------------------------- 0 TADA_ARATH 651 LVSEEMQGSETTLIPPSSQLVSRRSGQSYRTGGVSIQEISHGTSESGYTT 700 GUAD_BACSU 0 -------------------------------------------------- 0 TADA_ARATH 701 AFEHPRAGASVNSQSAGELMGFTSHEDAMGSAHRLEQASEKYVGEFVKKA 750 GUAD_BACSU 0 -------------------------------------------------- 0 TADA_ARATH 751 KHGVINPETEEQRAESNQLKRRDSRRSSGGSGAKGPSDEMWVTDSAQGTP 800 GUAD_BACSU 0 -------------------------------------------------- 0 TADA_ARATH 801 HPGATEGNAAVGNAIFKRNGRSLWNVIADIARLRWGSRAGSPDSSAKPAG 850 GUAD_BACSU 0 -------------------------------------------------- 0 TADA_ARATH 851 RSSPNESVSSATWFSGREHDGSSDDNTKGDKVLPQEAPSLHQVEVGQTSP 900 GUAD_BACSU 0 -------------------------------------------------- 0 TADA_ARATH 901 RSQSEYPGTTKLKQRSERHEGVVSSPSSTILEGGSVSNRMSSTSGNQIVG 950 GUAD_BACSU 0 -------------------------------------------------- 0 TADA_ARATH 951 VDEEEGGNFEFRLPETALTEVPMKLPSRNLIRSPPIKESSESSLTEASSD 1000 GUAD_BACSU 0 -------------------------------------------------- 0 TADA_ARATH 1001 QNFTVGEGRRYPRMDAGQNPLLFPGRNLRSPAVMEPPVPRPRMVSGSSSL 1050 GUAD_BACSU 0 -------------------------------------------------- 0 TADA_ARATH 1051 REQVEQQQPLSAKSQEETGSVSADSALIQRKLQRNKQVVRDSFEEWEEAY 1100 GUAD_BACSU 1 -------MNHETFLKRAVTLACEGVNAGIGGPFGAVIVKDGAIIAEGQNN 43 ...|.|::.|:..|.:..:.. ..|.|||:|.||.|||.|.|. TADA_ARATH 1101 KVEAERRTVDEIFMREALVEAKKAADTW-EVPVGAVLVHDGKIIARGYNL 1149 GUAD_BACSU 44 VTTSNDPTAHAEVTAIRKACKVLGAYQLDDCILYTSCEPCPMCLGAIYWA 93 |....|.|||||:..||:..|.|.:::|.|..||.:.||||||.|||..| TADA_ARATH 1150 VEELRDSTAHAEMICIREGSKALRSWRLADTTLYVTLEPCPMCAGAILQA 1199 GUAD_BACSU 94 RPKAVFYAAEHTDAAEAGFDDSFIY---------KEIDKPAEERTIPFYQ 134 |...:.:.|.: ...|.|.|:|. .|..:.......||:. TADA_ARATH 1200 RVNTLVWGAPN---KLLGADGSWIRLFPGGEGNGSEASEKPPPPVHPFHP 1246 GUAD_BACSU 135 -------VTLTEHLSPFQAWRNFANKKEY--------------------- 156 |..:|.....|.:.....||:. TADA_ARATH 1247 KMTIRRGVLESECAQTMQQFFQLRRKKKDKNSDPPTPTDHHHHHLPKLLN 1296 GUAD_BACSU 156 ----------- 156 TADA_ARATH 1297 KMHQVLPFFCL 1307 #---------------------------------------Выранивание, построенное программой water(команда water sw:guad_bacsu sw:TADA_ARATH water.water):
# Aligned_sequences: 2 # 1: GUAD_BACSU # 2: TADA_ARATH # Matrix: EBLOSUM62 # Gap_penalty: 11.0 # Extend_penalty: 1.0 # # Length: 99 # Identity: 43/99 (43.4%) # Similarity: 57/99 (57.6%) # Gaps: 1/99 ( 1.0%) # Score: 190.0 # #======================================= GUAD_BACSU 4 ETFLKRAVTLACEGVNAGIGGPFGAVIVKDGAIIAEGQNNVTTSNDPTAH 53 |.|::.|:..|.:..:.. ..|.|||:|.||.|||.|.|.|....|.||| TADA_ARATH 1111 EIFMREALVEAKKAADTW-EVPVGAVLVHDGKIIARGYNLVEELRDSTAH 1159 GUAD_BACSU 54 AEVTAIRKACKVLGAYQLDDCILYTSCEPCPMCLGAIYWARPKAVFYAA 102 ||:..||:..|.|.:::|.|..||.:.||||||.|||..||...:.:.| TADA_ARATH 1160 AEMICIREGSKALRSWRLADTTLYVTLEPCPMCAGAILQARVNTLVWGA 1208 #---------------------------------------
Чем выравнивали | BLAST | needle | water |
Вес (score) | 199 | 167 | 190 |
% идентичности | 43/99 (43.4%) | 55/1311 ( 4.2%) | 43/99 (43.4%) |
% сходства | 57/99 (57.6%) | 76/1311 ( 5.8%) | 57/99 (57.6%) |
Длина выравнивания | 99 | 1311 | 99 |
Число гэпов | 1/99 (1.0%) | 1159/1311 (88.4%) | 1/99 ( 1.0%) |
Выравнивания, полученные с помощью BLAST и water, абсолютно одинаковы. Только почему-то различается вес (я не знаю почему). А если сравнить их с тем, что получили с помощью needle, то заметим то же самое на этом участке.
Наверх