Поиск организма по фрагменту нуклеотидной последовательности
По заданному 300-нуклеотидному фрагменту (9) с помощью программы BLAST по алгоритму megablast со стандартными настройками в базе данных RefSeq был найден организм, которому и принадлежит данный фрагмент.
Данный фрагмент принадлежит Buchnera aphidicola str. Sg (Schizaphis graminum), AC записи RefSeq - NC_004061. Координаты данного фрагмента в записи (1145-1444) являются частью большего гена gidA, который кодирует белок GidA.
Поиск гомолога белка человека в слоне
Был выбран белок, идентификатор которого начинается с той же буквы, что и моя фамилия - YES_HUMAN. Далее была получена последовательность белка:
>YES_HUMAN P07947 Tyrosine-protein kinase Yes (2.7.10.2) (Proto-oncogene c-Yes) (p61-Yes)
MGCIKSKENKSPAIKYRPENTPEPVSTSVSHYGAEPTTVSPCPSSSAKGTAVNFSSLSMT
PFGGSSGVTPFGGASSSFSVVPSSYPAGLTGGVTIFVALYDYEARTTEDLSFKKGERFQI
INNTEGDWWEARSIATGKNGYIPSNYVAPADSIQAEEWYFGKMGRKDAERLLLNPGNQRG
IFLVRESETTKGAYSLSIRDWDEIRGDNVKHYKIRKLDNGGYYITTRAQFDTLQKLVKHY
TEHADGLCHKLTTVCPTVKPQTQGLAKDAWEIPRESLRLEVKLGQGCFGEVWMGTWNGTT
KVAIKTLKPGTMMPEAFLQEAQIMKKLRHDKLVPLYAVVSEEPIYIVTEFMSKGSLLDFL
KEGDGKYLKLPQLVDMAAQIADGMAYIERMNYIHRDLRAANILVGENLVCKIADFGLARL
IEDNEYTARQGAKFPIKWTAPEAALYGRFTIKSDVWSFGILQTELVTKGRVPYPGMVNRE
VLEQVERGYRMPCPQGCPESLHELMNLCWKKDPDERPTFEYIQSFLEDYFTATEPQYQPG
ENL
Был произведен поиск данного белка в геноме Loxodonta africana при помощи EMBL ENA.
E-Value лучшего выравнивания равен 0. Длина выравнивания - 543, identity - 97%,а координаты в геноме слона- 90550151->90604105. Интронов десять штук.
Поиск некодирующих последовательностей программой BLAST
Для изучения была выбрана бактерия Chloroherpeton thalassium. В ее геноме была выбрана и вырезана в отдельный файл последовательность tRNA-Asp1.
FT tRNA 236301..236378
FT /locus_tag="Ctha_R0002"
FT /product="tRNA-Asp"
>CP001100 CP001100.1 Chloroherpeton thalassium ATCC 35110, complete genome.
ggagccgtagctcagtttggttagagcgcctgcctgtcacgcaggaggccgcgggttcga
gtcccgtcggctccgcaa
Изучаемая бактерия принадлежит к порядку Chlorobiales.
Был произведен поиск гомологов с помощью алгоритмов megablast, blastn (обычной) и blastn (c длиной слова = 7, match/mismatch = 1/-1) по базе данных refseq_genomic.
С каждым из алгоритмов были найдены одни и те же гомологи с одним и тем же identity. Отличия были только в E-value, Max score и Total score.
Таблица N1.Сравнение алгоритмов megablast, blastn (обычный) и blastn (c длиной слова = 7, match/mismatch = 1/-1) поиска гомологов последовательности tRNA-Asp
Sequence ID |
Max score (megablast) |
Max score (blastn) |
Max score (blastn длина слова = 7; match/mismatch = 1/-1) |
Total score (megablast) |
Total score (blastn) |
Total score (blastn длина слова = 7; match/mismatch = 1/-1) |
E-value (megablast) |
E-value (blastn) |
E-value (blastn длина слова = 7; match/mismatch = 1/-1) |
Identity |
ref|NC_011026.1| |
145 |
141 |
125 |
122 |
284 |
954 |
3e-35 |
3e-34 |
3e-29 |
100% |
ref|NC_011059.1| |
132 |
131 |
117 |
132 |
131 |
1025 |
3e-31 |
5e-31 |
6e-27 |
97% |
ref|NC_011027.1| |
126 |
125 |
114 |
126 |
163 |
1036 |
1e-29 |
2e-29 |
6e-26 |
96% |
ref|NC_010831.1| |
122 |
123 |
112 |
122 |
161 |
1068 |
2e-28 |
8e-29 |
2e-25 |
95% |
ref|NC_010803.1| |
122 |
123 |
112 |
122 |
159 |
1047 |
2e-28 |
8e-29 |
2e-25 |
95% |
ref|NC_007514.1| |
122 |
123 |
112 |
122 |
123 |
914 |
2e-28 |
8e-29 |
2e-25 |
95% |
ref|NC_008639.1| |
119 |
120 |
109 |
119 |
120 |
1087 |
2e-27 |
1e-27 |
2e-24 |
94% |
ref|NC_011060.1| |
117 |
118 |
109 |
117 |
118 |
1046 |
7e-27 |
3e-27 |
2e-24 |
95% |
ref|NC_007512.1| |
117 |
118 |
109 |
117 |
118 |
1122 |
7e-27 |
3e-27 |
2e-24 |
94% |
ref|NC_002932.3| |
115 |
116 |
107 |
115 |
154 |
1118 |
3e-26 |
1e-26 |
5e-24 |
94% |
ref|NC_009337.1| |
113 |
114 |
106 |
113 |
114 |
900 |
9e-26 |
4e-26 |
1e-23 |
93% |
|