назад к третьему семестру
1. Зачетное задание №1
Использовались команды
seqret AALF01000002.embl -sask
Для того чтобы проиндексировать протеом для поиска программами пакета BLAST использовалась следующая команда
formatdb -i salty_proteome.fasta -n salt -p T
Из программ пакета BLAST была выбрана программа BLASTX, т.к. она предназначается для анализа новых нуклеотидных последовательностей и для предсказания кодирующих участков.
Используемая команда:
blastall -p blastx -d salt –i aafl01000002.fasta -o result.fasta -F F
Рассматривались только очень похожие последовательности (E-value<0,001).
[=>ген Q8ZNV2 3271. . .1514]
[=>ген P67179 883. . .143]
[=>ген Q8ZNV3 1357 . . .917]
[=>ген Q7CQC7 3575 . . .3997]
[=>ген Q8ZK08 868. . .176]
[=>ген P28354 3220. . .2408]
[=>ген P58696 1912. . .1601]
[=>ген Q9ZJ12 2860. . .2369]
[=>ген Q8ZK28 1457 . . . 1341]
[=>ген Q8ZPV3 1339 . . . 1166]
из полученных результатов видно, что координаты некоторых генов перекрываются, в результате получилось следующее:-
Гипотетические гены во фрагменте 14001-18001
3'--[<=ген P67179 143. . . 883]-- [<=ген Q8ZNV3 917 . . . 1357]--[<=ген Q8ZK28 1341 . . .1457 ]--- [<=ген P58696 1601. . .1912]-- [<=ген P28354 2408. . .3220] --------------------------------5'
5’---------------------------------------------------------------------------------------------------------------------------------------------------------------[=>ген Q7CQC7 3575 . . .3997] 3’
С помощью одного запроса в SRS были найдены все соответствующие белки в UniProt Q8ZPV3|P28354|P58696
(([uniprot-AccNumber:Q8ZPV3*] | [uniprot-AccNumber:P28354*]) | [uniprot-AccNumber:P58696*])
Получили следующую информацию:
Было найдено 6 записей:
EMBL:AE008743 EMBL:AE008784 EMBL:AE008785 EMBL:AE008839 EMBL:AE008910 EMBL:M38590
AC находки в БД UniProt | EMBL:AE008743 | EMBL:AE008784 | EMBL:AE008785 | EMBL:AE008839 | EMBL:AE008910 |
P67179 |
- | gene complement(18989..19449)gene ntpA | - | - | - |
Q8ZNV3 |
- | gene complement(19544..21328)gene aspS | - | - | - |
Q8ZK28 |
- | - | - | - | gene 7449..8549 gene yjgP | - |
P58696 |
gene STM1001 gene complement(8270..8737) | - | - | - | - |
P28354 |
- | - | - | gene complement(21329..22210) gene prfB | - |
Q7CQC7 |
- | - | gene 738..1576 gene yecE | - | - |
3'- [<= gene ntpA(18989..19449) ] --[<= gene aspS(19544..21328) ]----------------------------------5'
5'------------------------------------------------------------------[=> gene yecE 738..1576]-------3'
Сравнивая полученные результаты с результатами гипотетических генов во фрагменте, видно, что трое из генов(gene ntpA,gene aspS,gene yecE )
расположены одинаково, также как и при гипотетических генах, а остальнын гены расположенные в случае гипотетических генов рядом,в последнем случае
находятся в абсолютно разных местах.Длина записи EMBL:AE008784 составляет 21506, поэтому гены на схеме следует распологать именно в такой последовательности,
хоть и по координатам кажется иначе.