Команды используемые для выполнения задания: seqret /home/export/samba/public/tmp/AALF01000001.embl -sask (команда для извлечения из последовательности AALF01000001 4000 нуклеотидов.) formatdb -i /home/export/samba/public/tmp/salty_proteome.fasta -n st -p t (команда для создания индексных файлов протеома бактерии Salmonella typhimuriu, по которому будет проводиться поиск)blastall -p blastx -d st -i aalf01000001.fasta -o results.txt -e 0.001 (программа BLASTX была выбрана по тому, какая пробная последовательность водилась (нуклеотидная) и по типу банка данных (белок), а также т.к. задача, выполняемая этой программой, наиболее соответствовала поставленной перед нами)
Исследование полученного файла
Было получено 8 выравниваний с E-value меньше 0,001. Результаты и выравнивания можно найти в файле:results.txt
Список лучших находок: Q8ZPZ0 Q8ZPZ0_SALTY Isocitrate dehydrogenase in e14 prophage (EC... 740 0.0 Q8ZPZ1 RLUE_SALTY Ribosomal large subunit pseudouridine synthase... 306 9e-84 Q8ZPZ3 Q8ZPZ3_SALTY Putative MutT-like protein. 164 3e-41 Q8ZP51 RLUB_SALTY Ribosomal large subunit pseudouridine synthase... 80 1e-15 Q8ZKL1 RLUF_SALTY Ribosomal large subunit pseudouridine synthase... 73 2e-13 P65840 RSUA_SALTY Ribosomal small subunit pseudouridine synthase... 71 6e-13 P37412 LEU3_SALTY 3-isopropylmalate dehydrogenase (EC 1.1.1.85) ... 58 4e-09 Q8ZPV3 Q8ZPV3_SALTY Putative mutator MutT protein. 46 2e-05 Так как многие находки имеют перекрывающиеся координаты,всего нашлось три предполагаемых гена: 5'--------------------------------------------------[1129-2283 P37412=>]---3' 3'--[<=1-291 Q8ZPZ3]---[<=296-910 Q8ZPZ1]----------------------------------5'Далее введем запрос в SRS: ((([uniprot-AccNumber:Q8ZPZ3*] | [uniprot-AccNumber:Q8ZPZ1*]) | [uniprot-AccNumber:P37412*]) > EMBL )
Получаем такие результаты: EMBL:AE008699 EMBL:AE008754 EMBL:U20795 EMBL:X53376 Изучая полученные документы, находим:
AC в UniProt | AC в EMBL | Координаты в геноме Salmonella typhimurium |
Q8ZPZ1 | AE008754 | ymfC complement(4148..4813) section 58 |
Q8ZPZ3 | AE008754 | ymfB complement(3349..3820) section 58 |
P37412 | AE008699 | leuB 22..1101 section 7 |
Таким образом из таблицы можно увидеть,что два гена ymfC и ymfB находятся в одном секторе генома и довльно близко друг от друга, что похоже на результаты выравнивания. Третий же ген найден в совершенно другом секторе и на прямой цепи, тогда как два первых - на комплементарной.
©Пономарева Ольга