Самостоятельная работа.


1. Я извлекла фрагмент (35001-42000) генома O.scapharcae из записи AEWH01000006 банка EMBL в файл aewh01000006.fasta с помощью команды:
seqret AEWH01000006.embl -sask
2. Получила файл 2npd_bacsu.fasta, содержащий полный протеом B. subtilis из Swiss-Prot с помощью команды:
seqret sw:*_bacsu
3. Извлекла из фрагмента генома трансляции всех открытых рамок считывания длиной не менее 240 нуклеотидов с помощью команды:
getorf aewh01000006.fasta -minsize 240 -find 1 -table 11 файл aewh01000006.orf
Было найдено 12 рамок.
4. Получила информацию о рамках с помощью команды:
grep ">" aewh01000006.orf > aewh01000006.txt
Полученную информацию экспортировала в файл файл aewh01000006.xlsx
5. С помощью BLAST нашла сходные последовательности в протеоме B. subtilis
makeblastdb -in bacsu.fasta -out bacsu -dbtype prot
blastp -db bacsu -query aewh01000006.orf -outfmt 6 -evalue 0.001 > blastp.txt -task blastp
6.Скрипт , которым из выдачи BLAST получила число гомологов для каждой рамки.
7. Таблица с результатами
Открытая рамка считывания начало конец направление число сходных последовательностей Идентификатор самого близкого из найденных белков E-value находки
AEWH01000006_2 1173 1841 прямое 3 YJBM_BACSU 6e-77
AEWH01000006_3 1860 2657 прямое 2 PPNK1_BACSU 7e-106
AEWH01000006_4 2679 3557 прямое 4 YJBO_BACSU 1e-83
AEWH01000006_8 5784 7001 прямое 4 MGTE_BACSU 1e-71
AEWH01000006_9 5542 4370 обратное 3 RODA_BACSU 6e-50
AEWH01000006_10 4370 3567 обратное 1 PRPE_BACSU 5e-82
AEWH01000006_11 1073 501 обратное 1 YJBK_BACSU 4e-37
AEWH01000006_12 405 28 обратное 1 TRHBO_BACSU 3e-38
8. Предсказанные гены во фрагменте 35001-42000 записи AEWH01000006

3'-[<= trhbo, 28-405]-[<= yjbk, 501-1073]--------------------------------------------------------------------------------------5'
5'------------------------------------------[=> yjbm, 1173-1841]----[=> ppnk1, 1860-2657]-----[=> yjbo, 2679-3557]-------------3'


3'--[<= prpe, 3567-4370][<= roda, 4370-5542]---------------------------------------------------------5'
5'-------------------------------------------------------------------------------[=> mgte, 5784-7001]3'
9.В записи AL009126 банка EMBL, содержащей последовательность генома сенной палочки, найдены участки, кодирующие искомые белки, и рассмотрим их расположение в геноме:

   3'-[<= trhbo, 1234510-1234908]-[<= yjbk, 1235912-1236484]----------------------------5'
 5'--------------------------------------------------------[=> yjbm, 1237006-1237641]-3'

 3'--------------------------------------------------------[<= prpe, 1239387-1240121]-5'
 5'-[=> ppnk1, 1237660-1238460]-[=> yjbo, 1238523-1239374]----------------------------3'

 3'----------------------------------[<= roda, 3912332-3913513]-----------------------5'
 5'---[=> mgte, 1396013-1397368]------------------------------------------------------3'

Видно, что все гены, за исключением mgtE и rodA, расположены достаточно близко друг к другу. Взаимное расположение всех 6 из них совпадает с расположением предсказанных генов Ornithinibacillus scapharcae. Их можно считать консервативными.
© Julia Chudakova