на главную
назад

Аннотация генома

Поиск в геноме участков, кодирующих белки, похожие на Rho_ecoli.

С помощью команд entret embl:AALF01000001 -auto и seqret aalf01000001.entret –sask получил нуклеотидную последовательность с 42001 по 46000 нуклеотида из генома Yersinia intermedia.

Проиндксировал протеом Salmonella typhimurium (formatdb -i salty_proteome.fasta -p T -n st).

Для поиска в нуклеотидной последовательности закодированных белков, похожих на белки Salmonella typhimurium используем программу blastx, т.к. мы подаем на вход нуклеотидную последовательность в банк аминокислотной последовательности, и наша задача состоит в том, чтобы анализировать неаннотированный участок генома, т.е. узнать, какие белки он кодирует.

blastall -p blastx -d st -i aalf01000001.fasta -o stres.txt
blastx нашел 5 аминокислотных последовательностей, которые кодируются в нуклеотидной последовательности, поданной на вход, близкие к тем которые содержаться в протеоме Salmonella typhimurium.

файл выравнивания

Теперь расположим гипотетические гены на схеме, где для каждого возьмем название, какое имеется у наиболее сходного гомолога из сальмонеллы.

Гипотетические гены во фрагменте 42001-46000(Yersinia intermedia):


5’------------------------------------------------------------------------------------------------------------------------------------3'

3’-[<= ген ecnR, 88..630]--[<= ген solA, 896…2011]--[<= ген yceP, 2284…2535]--[<= ген dinI,2807..3040]---[<= ген pyrC,3160…3999 ]-----5'


Установим связь с EMBL.

Введем запрос в SRS, в котором запишем AC находок и установим связь с EMBL. (((((((((([libs={uniprot swissprot}-AccNumber:P58525*] | [libs={uniprot swissprot}-AccNumber:P06204*]) | [libs={uniprot swissprot}-AccNumber:Q8ZQ21*]) | [libs={uniprot swissprot}-AccNumber: Q8ZQ20*]) | [libs={uniprot swissprot}-AccNumber:Q8ZKB6*]) | [libs={uniprot swissprot}-AccNumber:Q8XGS7*]) | [libs={uniprot swissprot}- AccNumber:P54698*]) | [libs={uniprot swissprot}-AccNumber:P0A1G3*]) | [libs={uniprot swissprot}-AccNumber:Q8ZP34*]) | [libs={uniprot swissprot}-AccNumber:Q8ZMS6*]) > EMBL )

AC находки в UniProt AC EMBL Координаты в геноме Salmonella typhimurium
P58525 AE008750 ген solA complement (10209..11327)
P06204 AE008750 ген pyrC complement (12303..13349)
Q8ZQ21 AE008750 ген yceP complement (11440..11694)
Q8ZQ20 AE008750 ген dinI complement (11984..12229)
Q8ZKB6 AE008903 ген ecnR, complement(15517..16104)

Теперь расположим гипотетические гены на схеме, где для каждого возьмем название, какое имеется у наиболее сходного гомолога из сальмонеллы. Посмотрим на расположение ближайших гомологов в геноме Salmonella typhimurium для каждой находки.
Интересно заметить, что для четырех генов ( solA, yceP, dinI, pyrC) в целом расположение в обоих геномах сходное. Относительно друг друга они расположены одинаково. Сходное расположение гомологичных генов говорит о том, что выбранные нами находки программы blastx, можно рассматривать как гены Yersinia intermedia А вот для расположение гена ecnR относительно других генов в организме прототипе отличается от расположения его в последовательности Yersinia intermedia
Расположим гены в геноме сальмонеллы, чтобы нагляднее было видна сходность расположения.

Гены в геноме организма-прототипа Salmonella typhimurium.


5’ ---------------------------------------------------------------------------------------------------------------------------

3’---[<=ген solA,10209..11327,section 54]---[<=ген yceP,11440..11694,section 54]----[<=ген dinI,11984..12229,section 54]-------
      
                                                                          
----------------------------------------------------------------------------------------------------------------------3’

--[<=ген pyrC,12303..13349,section 54]--[<=ген ecnR,15517..16104,section 207]-----------------------------------------5’

©Ивин Юрий