Самостоятельная работа.
1. Я извлекла фрагмент (35001-42000) генома O.scapharcae
из записи AEWH01000006 банка EMBL в файл aewh01000006.fasta
с помощью команды:
seqret AEWH01000006.embl -sask
2. Получила файл 2npd_bacsu.fasta, содержащий полный протеом B. subtilis из Swiss-Prot
с помощью команды:
seqret sw:*_bacsu
3. Извлекла из фрагмента генома трансляции всех открытых
рамок считывания длиной не менее 240 нуклеотидов с помощью
команды:
getorf aewh01000006.fasta -minsize 240 -find 1 -table 11 файл aewh01000006.orf
Было найдено 12 рамок.
4. Получила информацию о рамках с помощью команды:
grep ">" aewh01000006.orf > aewh01000006.txt
Полученную информацию экспортировала в файл файл aewh01000006.xlsx
5. С помощью BLAST нашла сходные последовательности в протеоме B. subtilis
makeblastdb -in bacsu.fasta -out bacsu -dbtype prot
blastp -db bacsu -query aewh01000006.orf -outfmt 6 -evalue 0.001 > blastp.txt -task blastp
6.Скрипт
, которым из выдачи BLAST получила число гомологов
для каждой рамки.
7. Таблица с результатами
Открытая рамка считывания |
начало |
конец |
направление |
число сходных последовательностей |
Идентификатор самого близкого из найденных белков |
E-value находки |
AEWH01000006_2 |
1173 |
1841 |
прямое |
3 |
YJBM_BACSU |
6e-77 |
AEWH01000006_3 |
1860 |
2657 |
прямое |
2 |
PPNK1_BACSU |
7e-106 |
AEWH01000006_4 |
2679 |
3557 |
прямое |
4 |
YJBO_BACSU |
1e-83 |
AEWH01000006_8 |
5784 |
7001 |
прямое |
4 |
MGTE_BACSU |
1e-71 |
AEWH01000006_9 |
5542 |
4370 |
обратное |
3 |
RODA_BACSU |
6e-50 |
AEWH01000006_10 |
4370 |
3567 |
обратное |
1 |
PRPE_BACSU |
5e-82 |
AEWH01000006_11 |
1073 |
501 |
обратное |
1 |
YJBK_BACSU |
4e-37 |
AEWH01000006_12 |
405 |
28 |
обратное |
1 |
TRHBO_BACSU |
3e-38 |
8. Предсказанные гены во фрагменте 35001-42000 записи AEWH01000006
3'-[<= trhbo, 28-405]-[<= yjbk, 501-1073]--------------------------------------------------------------------------------------5'
5'------------------------------------------[=> yjbm, 1173-1841]----[=> ppnk1, 1860-2657]-----[=> yjbo, 2679-3557]-------------3'
3'--[<= prpe, 3567-4370][<= roda, 4370-5542]---------------------------------------------------------5'
5'-------------------------------------------------------------------------------[=> mgte, 5784-7001]3'
9.В записи AL009126 банка EMBL, содержащей последовательность генома сенной палочки, найдены
участки, кодирующие искомые белки, и рассмотрим их
расположение в геноме:
3'-[<= trhbo, 1234510-1234908]-[<= yjbk, 1235912-1236484]----------------------------5'
5'--------------------------------------------------------[=> yjbm, 1237006-1237641]-3'
3'--------------------------------------------------------[<= prpe, 1239387-1240121]-5'
5'-[=> ppnk1, 1237660-1238460]-[=> yjbo, 1238523-1239374]----------------------------3'
3'----------------------------------[<= roda, 3912332-3913513]-----------------------5'
5'---[=> mgte, 1396013-1397368]------------------------------------------------------3'
Видно, что все гены, за исключением mgtE и rodA, расположены
достаточно близко друг к другу. Взаимное расположение всех
6 из них совпадает с расположением предсказанных генов
Ornithinibacillus scapharcae. Их можно считать консервативными.
© Julia Chudakova