Поиск в геноме участков, кодирующих белки, похожие на Rho_ecoli.
С помощью команд entret embl:AALF01000001 -auto и seqret aalf01000001.entret –sask получил нуклеотидную последовательность с 42001 по 46000 нуклеотида из генома Yersinia intermedia.
Проиндксировал протеом Salmonella typhimurium (formatdb -i salty_proteome.fasta -p T -n st).
Для поиска в нуклеотидной последовательности закодированных белков, похожих на белки Salmonella typhimurium используем программу blastx, т.к. мы подаем на вход нуклеотидную последовательность в банк аминокислотной последовательности, и наша задача состоит в том, чтобы анализировать неаннотированный участок генома, т.е. узнать, какие белки он кодирует.
blastall -p blastx -d st -i aalf01000001.fasta -o stres.txt
blastx нашел 5 аминокислотных последовательностей, которые кодируются в нуклеотидной последовательности,
поданной на вход, близкие к тем которые содержаться в протеоме Salmonella typhimurium.
файл выравнивания
Теперь расположим гипотетические гены на схеме, где для каждого возьмем название, какое имеется у наиболее сходного гомолога из сальмонеллы.
Гипотетические гены во фрагменте 42001-46000(Yersinia intermedia):
Введем запрос в SRS, в котором запишем AC находок и установим связь с EMBL. (((((((((([libs={uniprot swissprot}-AccNumber:P58525*]
| [libs={uniprot swissprot}-AccNumber:P06204*]) | [libs={uniprot swissprot}-AccNumber:Q8ZQ21*]) | [libs={uniprot swissprot}-AccNumber:
Q8ZQ20*]) | [libs={uniprot swissprot}-AccNumber:Q8ZKB6*]) | [libs={uniprot swissprot}-AccNumber:Q8XGS7*]) | [libs={uniprot swissprot}-
AccNumber:P54698*]) | [libs={uniprot swissprot}-AccNumber:P0A1G3*]) | [libs={uniprot swissprot}-AccNumber:Q8ZP34*]) | [libs={uniprot
swissprot}-AccNumber:Q8ZMS6*]) > EMBL ) Теперь расположим гипотетические гены на схеме, где для каждого возьмем название,
какое имеется у наиболее сходного гомолога из сальмонеллы.
Посмотрим на расположение ближайших гомологов в геноме Salmonella typhimurium для каждой находки. Гены в геноме организма-прототипа Salmonella typhimurium.
5’------------------------------------------------------------------------------------------------------------------------------------3'
3’-[<= ген ecnR, 88..630]--[<= ген solA, 896…2011]--[<= ген yceP, 2284…2535]--[<= ген dinI,2807..3040]---[<= ген pyrC,3160…3999 ]-----5'
Установим связь с EMBL.
AC находки в UniProt
AC EMBL
Координаты в геноме Salmonella typhimurium
P58525
AE008750
ген solA complement (10209..11327)
P06204
AE008750
ген pyrC complement (12303..13349)
Q8ZQ21
AE008750
ген yceP complement (11440..11694)
Q8ZQ20
AE008750
ген dinI complement (11984..12229)
Q8ZKB6
AE008903
ген ecnR, complement(15517..16104)
Интересно заметить, что для четырех генов ( solA, yceP, dinI, pyrC) в целом расположение в обоих геномах сходное. Относительно друг друга они расположены одинаково.
Сходное расположение гомологичных генов говорит о том, что выбранные нами находки программы blastx, можно рассматривать как гены Yersinia intermedia
А вот для расположение гена ecnR относительно других генов в организме прототипе отличается от расположения его в последовательности Yersinia intermedia
Расположим гены в геноме сальмонеллы, чтобы нагляднее было видна сходность расположения.
5’ ---------------------------------------------------------------------------------------------------------------------------
3’---[<=ген solA,10209..11327,section 54]---[<=ген yceP,11440..11694,section 54]----[<=ген dinI,11984..12229,section 54]-------
----------------------------------------------------------------------------------------------------------------------3’
--[<=ген pyrC,12303..13349,section 54]--[<=ген ecnR,15517..16104,section 207]-----------------------------------------5’
©Ивин Юрий