предсказание генов

1 задание

Всего гипотетические гомологи нашлись для 4 рамок в последовательности
номер рамки координаты на участке направление последовательность название лучшей находки e-value
1 134-511 прямое MTDETSLLIGVPFWSTYFLFYLFLSAKIDVNEDLGGLSKMGVRAEATPNPNAIKFTTDKIIFEG
TNSISVKPGDTSEHEIMNDLLQLEGVDNVFGYQNFITINKSFDAEWDDVTPRVKEVFEKHGY
YPGR_BACSU 1e-04
2 1926-2804 прямое MGLKVTRVSVKIMADSASDLTKEYFSEYNMEMVSLTVHLDDKDYEDGINITPKNVFDAMRNGKS
PKTSQVPPQAFKSIFTEYAKSKQPLVYLAFSSELSGTYQTAKMMEQEVKEEYPEADIHVMDTKCA
SIGYGLVVLNAAKMAQEGKSMEEIIDDAEKRALHMEHIFTVDDLEYLKRGGRVSKTAAFVGSLLN
IKPILHVEDGKLIPLEKMRGTKKLLGRILEIMEERGGNLENQVVGISHGDDLERAEKLAEMIKEK
FGVKEVVIEYVGSAIGAHAGPGTIALFFLNKSFY
YITS_BACSU 8e-91
5 6984-6097 обратное MPTLANDSVDLYEYQPFGEPTKAVSLDDPATFKIDGELPKIDGATALYPIYAAFVQATYPEKQY
DVYESEVISTRTPYAYENLINGKVDMIFALGPSEAQLKKAENRGVELKLTPIGKEAFVFFVNAK
NEVSGLTLDEIKKIYSGEITNWGDVGGANDSIRAFQRPADSGSQTTLEQLMADTPIMTPPTEDI
ISLMGGIIEETANYKNYKNAIGYTFRFYSNEMAKNDSIRHLAIDGIAPTLETIRNGEYPITETF
YVVTAGSENPNIEPFIEWILSSQGQSIIEKTGYVPIGSDL
PSTS_BACSU 6e-15
7 1849-1010 обратное MFLIEAKRILVVIIGSLLNALSLNLFLESANVYASGFTGSAQLISSVFNDFIGIGVSTGILLFL
LNIPVFILGWFKVGKGFTIYSIVSVIFSSIFLQFLPIVELSEDIILNAVFGGLVAGIGVGMTLK
VGASTGGMDIVAMVLSRMNDKPIGFYFITLNAIIIALAGILYEPENALYTMVALYVTTRVIDAI
HTRYNKLTAMIVTKKAKELQTAIHNTMVRGITILPAVGAYTNQEKHMLYLVITRYELYDLEKII
KEIDPEAFTNIVQTTGIYGFFRKE
YITT_BACSU 2e-106

2 задание

Гипотетические гены во фрагнменте 77001-8400 записи AEWH01000006

3'--[YPGR, 134-511 =>]----------------------[YITS, 1926-2804 =>]-----------------------------------5'

5'---------------------[<= YITT, 1849-1010]----------------------------------[<= PSTS, 6984-6097]--3'
                    

3 задание

Расположение гомологичных генов в геноме Bacillus subtilis

3'---------------[YITS, 1187700-1188551 =>]---------[YPGR, 2302727-2303860 =>]--[PSTS, 2580715-2581617 =>]-------------------5'

5'----------------[<= YITT, 1188689-1189531]---------------------------------------------------------------------------------3'
                    
P.S. Отличная штука!

комментарии

Как видно, e-value белков YITT и YITS такие, что ошибиться просто невозможно, и в геноме сенной палочки они как раз находятся рядом и на разных цепочках, что, учитывая родство организмов, показывает, что эти гены абсолютные гомологи, в то время как e-value других белков не столь высоки(хотя и очень приличные), и расположены они далеко как от пары YITT/YITS, так и друг от друга, так что это либо действительно гомологи, но почему-то изменившие свое положение в геноме(например из-за плазмид), либо, кто-то из них, возможно, оказался случайным совпадением с рамкой