Лого
corner   corner
 
   

Поиск организма по фрагменту нуклеотидной последовательности

По заданному 300-нуклеотидному фрагменту (9) с помощью программы BLAST по алгоритму megablast со стандартными настройками в базе данных RefSeq был найден организм, которому и принадлежит данный фрагмент.

Данный фрагмент принадлежит Buchnera aphidicola str. Sg (Schizaphis graminum), AC записи RefSeq - NC_004061. Координаты данного фрагмента в записи (1145-1444) являются частью большего гена gidA, который кодирует белок GidA.

Поиск гомолога белка человека в слоне

Был выбран белок, идентификатор которого начинается с той же буквы, что и моя фамилия - YES_HUMAN. Далее была получена последовательность белка:

>YES_HUMAN P07947 Tyrosine-protein kinase Yes (2.7.10.2) (Proto-oncogene c-Yes) (p61-Yes)
MGCIKSKENKSPAIKYRPENTPEPVSTSVSHYGAEPTTVSPCPSSSAKGTAVNFSSLSMT
PFGGSSGVTPFGGASSSFSVVPSSYPAGLTGGVTIFVALYDYEARTTEDLSFKKGERFQI
INNTEGDWWEARSIATGKNGYIPSNYVAPADSIQAEEWYFGKMGRKDAERLLLNPGNQRG
IFLVRESETTKGAYSLSIRDWDEIRGDNVKHYKIRKLDNGGYYITTRAQFDTLQKLVKHY
TEHADGLCHKLTTVCPTVKPQTQGLAKDAWEIPRESLRLEVKLGQGCFGEVWMGTWNGTT
KVAIKTLKPGTMMPEAFLQEAQIMKKLRHDKLVPLYAVVSEEPIYIVTEFMSKGSLLDFL
KEGDGKYLKLPQLVDMAAQIADGMAYIERMNYIHRDLRAANILVGENLVCKIADFGLARL
IEDNEYTARQGAKFPIKWTAPEAALYGRFTIKSDVWSFGILQTELVTKGRVPYPGMVNRE
VLEQVERGYRMPCPQGCPESLHELMNLCWKKDPDERPTFEYIQSFLEDYFTATEPQYQPG
ENL

Был произведен поиск данного белка в геноме Loxodonta africana при помощи EMBL ENA.

E-Value лучшего выравнивания равен 0. Длина выравнивания - 543, identity - 97%,а координаты в геноме слона- 90550151->90604105. Интронов десять штук.

Поиск некодирующих последовательностей программой BLAST

Для изучения была выбрана бактерия Chloroherpeton thalassium. В ее геноме была выбрана и вырезана в отдельный файл последовательность tRNA-Asp1.

FT   tRNA            236301..236378
FT                   /locus_tag="Ctha_R0002"
FT                   /product="tRNA-Asp"

>CP001100 CP001100.1 Chloroherpeton thalassium ATCC 35110, complete genome.
ggagccgtagctcagtttggttagagcgcctgcctgtcacgcaggaggccgcgggttcga
gtcccgtcggctccgcaa

Изучаемая бактерия принадлежит к порядку Chlorobiales.

Был произведен поиск гомологов с помощью алгоритмов megablast, blastn (обычной) и blastn (c длиной слова = 7, match/mismatch = 1/-1) по базе данных refseq_genomic.

С каждым из алгоритмов были найдены одни и те же гомологи с одним и тем же identity. Отличия были только в E-value, Max score и Total score.

Таблица N1.Сравнение алгоритмов megablast, blastn (обычный) и blastn (c длиной слова = 7, match/mismatch = 1/-1) поиска гомологов последовательности tRNA-Asp

Sequence ID Max score (megablast) Max score (blastn) Max score (blastn длина слова = 7; match/mismatch = 1/-1) Total score (megablast) Total score (blastn) Total score (blastn длина слова = 7; match/mismatch = 1/-1) E-value (megablast) E-value (blastn) E-value (blastn длина слова = 7; match/mismatch = 1/-1) Identity
ref|NC_011026.1| 145 141 125 122 284 954 3e-35 3e-34 3e-29 100%
ref|NC_011059.1| 132 131 117 132 131 1025 3e-31 5e-31 6e-27 97%
ref|NC_011027.1| 126 125 114 126 163 1036 1e-29 2e-29 6e-26 96%
ref|NC_010831.1| 122 123 112 122 161 1068 2e-28 8e-29 2e-25 95%
ref|NC_010803.1| 122 123 112 122 159 1047 2e-28 8e-29 2e-25 95%
ref|NC_007514.1| 122 123 112 122 123 914 2e-28 8e-29 2e-25 95%
ref|NC_008639.1| 119 120 109 119 120 1087 2e-27 1e-27 2e-24 94%
ref|NC_011060.1| 117 118 109 117 118 1046 7e-27 3e-27 2e-24 95%
ref|NC_007512.1| 117 118 109 117 118 1122 7e-27 3e-27 2e-24 94%
ref|NC_002932.3| 115 116 107 115 154 1118 3e-26 1e-26 5e-24 94%
ref|NC_009337.1| 113 114 106 113 114 900 9e-26 4e-26 1e-23 93%
   
corner   corner
 


© Елисеев Алексей, 2014. Дата поселеднего изменения: 13.02.14