Протокол к первой контрольной.
-
Вырезаем участок последовательности
seqret AALF01000002.embl -sask
Reads and writes (returns) sequences
Begin at position [start]: 77001
End at position [end]: 81002
Reverse strand [N]: n
Создаём индексные файлы и делаем выравнивание
При помощи команд
formatdb -i salty_proteome.fasta -n salt -p T
blastall -p blastx -d salt -i aalf01000002.fasta -o salty1.fasta -F F -e 0.001
получено следующее:

Лучшее e-value e-162 у находки
>Q8ZPV2 ARGM_SALTY Succinylornithine transaminase (EC 2.6.1.-)
(Succinylornithine aminotransferase).
Length = 408
Score = 566 bits (1459), Expect = e-162
Identities = 279/404 (69%), Positives = 326/404 (80%)
Frame = -1
>Q8ZPV0 Q8ZPV0_SALTY Succinylglutamic semialdehyde dehydrogenase (EC
1.2.1.-).
Length = 492
>Q8ZPV1 Q8ZPV1_SALTY Arginine succinyltransferase (EC 2.3.1.109).
Length = 344
Score = 429 bits (1102), Expect = e-121
Identities = 217/343 (63%), Positives = 263/343 (76%), Gaps = 1/343 (0%)
Frame = -1
Score = 418 bits (1075), Expect = e-117
Identities = 200/304 (65%), Positives = 243/304 (79%)
Frame = -3
Изходя из полученных данных схема гена будет выглядеть так:
3'------[<=ген astC, 916-5]---[<=ген astA, 1965-940]---[<=ген astD, 3228-2017]-------5'
Информация о названиях генов получена с сайта SRS.
Ген astC находится в 60 секторе генома (18307..19533), astD - тоже в 60 (20555..22033) и astA тоже находится в 60 секторе (19524..20558).
То есть в геноме обеих бактерий эти гены находятся рядом, astC и astA даже немного перекрываются. И кроме того, в том же порядке.
Протокол к занятию.