seqret embl:AALF01000002 -saskс дальнейшим указанием координат начала и конца участка (21001-28000)
seqret sw:*_ECOLI > ecoli.fastaА также были созданы индексные файлы для поиска программами пакета BLAST.
formatdb -i ecoli.fasta -p T -n eco
getorf -minsize 240 -table 11 -find 1 > frames.orfПараметры:
Получен файл frames.orf
blastall -p blastp -d eco -i frames.orf -e 0.001 -o blast
seqret frames.orf:AALF01000002_1 stdout | blastall -p blastp -d eco -e 0.001| grep ">" -c > result.txt seqret frames.orf:AALF01000002_2 stdout | blastall -p blastp -d eco -e 0.001| grep ">" -c >> result.txt seqret frames.orf:AALF01000002_3 stdout | blastall -p blastp -d eco -e 0.001| grep ">" -c >> result.txt seqret frames.orf:AALF01000002_4 stdout | blastall -p blastp -d eco -e 0.001| grep ">" -c >> result.txt seqret frames.orf:AALF01000002_5 stdout | blastall -p blastp -d eco -e 0.001| grep ">" -c >> result.txt seqret frames.orf:AALF01000002_6 stdout | blastall -p blastp -d eco -e 0.001| grep ">" -c >> result.txt seqret frames.orf:AALF01000002_7 stdout | blastall -p blastp -d eco -e 0.001| grep ">" -c >> result.txt seqret frames.orf:AALF01000002_8 stdout | blastall -p blastp -d eco -e 0.001| grep ">" -c >> result.txt seqret frames.orf:AALF01000002_9 stdout | blastall -p blastp -d eco -e 0.001| grep ">" -c >> result.txt seqret frames.orf:AALF01000002_10 stdout | blastall -p blastp -d eco -e 0.001| grep ">" -c >> result.txt seqret frames.orf:AALF01000002_11 stdout | blastall -p blastp -d eco -e 0.001| grep ">" -c >> result.txtФайл frames.orf получен после использования команды getorf (см. пункт 3), содержит трансляции участка генома по всем открытым рамкам считывания, AALF01000002_N - идентификаторы рамок, result.txt - файл, содержащий столбец чисел, каждое из которых равно количеству сходных последовательностей из E.coli для соответствующей ORF. Параметр "-c" в программе grep позволяет посчитать количество строк в документе, которые содержат указанный символ (в данном случае ">").
Гипотетические гены во фрагменте [21001..28000]
5'-[=> yecP, 7-486]---------------------------------------------------------------------------------------[=> argS, 2484-4211]--------------------------------------3' 3'---------------------------------[<=cutC, 557-1318]----[<=yecM, 1571-2176]----------------------------------------------------------------------------------------5'
где значки => и <= обозначают прямую или комплементарную цепь ДНК соответственно, четырехсимвольный код - название самого сходного гена у E. coli, а координаты - местонахождение границ открытой рамки в данном фрагменте.
Расположение найденных генов у E. coli. на фрагменте [1950000..1960000]
5'-[=> yecP, 1466-2437]----------------------------------------------------------------------------------------------------------------------[=> argS, 8086-9819]--3' 3'---------------------------------------------------------------------------[<=cutC, 6544-7290]----[<=yecM, 7304-7870]--------------------------------------------5'
На главную страницу >>>
© Гурьянова Наталья Николаевна