Отчет студента 2 курса ФББ Кузеванова
Алексея Владимировича по работе
«Поиск регуляторных сигналов».
Задание №1. Поиск сигналов регуляции
транскрипции в бактериальных последовательностях.
AlignACE 3.0 Я получил вариант,
в котором содержится 18 последовательностей. При первой попытке
поиска сигнала я устанавливил Number of sites to expect равным 18. Поскольку не
удалось сразу же получить разницу весов между первым и вторым наборов сайтов в 1,5 раза, то
производил повторные попытки поиска сигнала, но уже с меньшими значениями Number of sites to expect. Ни при одном значении Number of sites to expect не удалось обнаружить наилучшего набора сайтов, поэтому за
наилучший выбрал тот набор, вес которого максимален среди всех первых наборов сайтов для
различных значений Number of sites to expect. Значение этого
параметра - 18. Результаты: AlignACE 3.0 04/13/02
Таким образом,
программа нашла 73 сайта. Обратно-комплементарные сайты: CAGAAGCGGGGCGCGCTGTCAGGTTTCG 10 419 0 CTGGATCGTGCGGCGCAGCATTTTTCCG 0
52 0 CGATGGCGACACGCGCCGGATTATTGCG 1
509 0 GAGCCGCGCGGCGACTACCAGATAATCG 6
44 0 CGGATGCGACGCGAGCGCCTTATCCGAC 0
268 0 GGTTAGCGAGAAGAGCCAGTAAAAGACG 16
231 0 GATTTCGGCGGCGAACTGCATGGTAGCC 1 559 0 GGTCAGCGCCACGCACTGTTCAATCACG 7 178 0 CGGCAGGGCGAGGAATAGCGTCTGCAGC 1 67 0 GCTATCCCCGAAGGGCGGGTTACTATCG 6 378 0 CTGCCGCCTGGCGCAACAGGTGATTTGC 7 56 0 CAAGCGCGGGGAGAGTTGCGTGTGAGCA 8 98 0 ATGCACCGCCGGGCGATGGGTATGCCCG 1 238 0 CGGTAGCGCAGTCCACCGCCAAAGCTCG 16 542 0 GGGTAGCCTGCTGACTTACGAAGCGACC 5 43 0 ACGGAGCGTCAGGAAGGGGTCAATGGCC 3 361 0 CCGCAACGGGCAGAATAGCAGGATTTTG 17 380 0 CAGCCGGCCGGTGAAGGGCTGCTGCAAC 6 5 0 CCTTCGGGTAAAGCATCGGCCCTAAACC 9 246 0 GAACCGGGAGCCTGGCAGCCTGAAAACG 8 563 0 CACCGCCCAGGTACGCTGCGCGATGTTC 6 150 0 CTGTTACGTAGATCGAAGGGGATGCGCC 10 455 0 CAACCGCCGGGTGACCTTCCGCCCACAG 6 114 0 CTGCTGCCGGGATACTCGTTTAACGCCC 16 110 0 CACTGGCGTGGATGGCGACGTATAAACC 4 88 0 GTACAGCTTGCCGCGCAGACGCAAATAC 15 248 0 CCTTGGCGCGAAAAGCCTGATAACCCGC 1 26 0 GCTGAGCGAAATGCATTAGCGCAAATCC 11 202 0 CTTGTGCCAGGGTAAAGGTTAGTTTTCG 5 335 0 CAATAACGCCACGCCATTCAACACAACC 11 243 0 GGAATGCCGACAGTGCAGGCGAACCACG 8 515 0 MEME (One per sequence)
Обратно-комплементарные сайты : codB 416 GCAATCGTTTTCGTGG ccacgaaaacgattgc pyrC 432 GGAAACGTTTTCCTTT aaaggaaaacgtttcc purA
377 CCAATCGTTTTCCTCA tgaggaaaacgattgg pdhR
153 ACAAACGGTTTCTTTT aaaagaaaccgtttgt folD
520 GCAATCGTTTTACCGT acggtaaaacgattgc rbsD
425 CGAAACGTTTTACATG catgtaaaacgtttcg araB
66 GCCAACGGTTATCTCG cgagataaccgttggc fixA
16 CCGAAGGTTTTCTTTC gaaagaaaaccttcgg acnB 451 GCAGGCGATTCTCTTC gaagagaatcgcctgc MEME (Zero or one per
sequence)
Обратно-комплементарные
сайты : cvpA
430 AAAGAAAACGTTTGCG cgcaaacgttttcttt purE 415 AAGGAAAACGGTTGCG cgcaaccgttttcctt purR 441 AAGGTAAACGTTTGCC ggcaaacgtttacctt purL 410 GACGAAACCGTTTGCG cgcaaacggtttcgtc purM 422 AAAGCAAACGTTTGCG cgcaaacgtttgcttt carA 265 CTGGAAAACGCTTGCG cgcaagcgttttccag guaB 433 AGCGTAACCGATTGCA tgcaatcggttacgct glnB 419 CTTGAAATCGTTTGCA tgcaaacgatttcaag rpiA 298 CAGTTCACCGTTCGCA tgcgaacggtgaactg >codB Ttggccgcccggcgcacgtctggtttgtctcgcaattgccaaaaacgcgatccggaaaaatgctgcgccgcacgatccaggcgatttgcgaaggacg Cgatcctggagatctgacgaccattgatgatcctgcgtcgttggatcagatccgccaggcgatggaagagtaggttattgtcggatgcgtcgcgcgg Tgcatccggcactgtgtgccgatgcctgatgcgacgctgacgcgttttatcatgcctacggacctgaaccgtaggtcggataaggcgctcgcgtcgc Atccgacaccatgctcagatgcctgatgcgacgctgacgcgtcttatcaggcctacccactgtttttacaccgataatttttcccccacctttttgc Actcattcatataaaaaatatatttccccacgaaaacgattgctttttatcttcagatgaatagaatgcggcggattttttgggtttcaaacagcaa Aaagggggaatttcgtgtcgcaagataacaactttagccaggggccagtcccgcagtcggcgcggaaaggggtattggcattgacgttcgtcatgct gggattaaccttcttttc >purE Atggcgacacgctgtgcaccgatgacgcgggttatcaggcttttcgcgccaaggtccacaaaccctggctgcagacgctattcctcgccctgccgtt Gtttgtgcgcaaacgcattgccgcgcgaatgcgcgcgaacagcaaagaagccaacagcagtaaatcgctggcgatcatggacgttaaccaaaacgcg Gtggtcagtgcgatggaaaaacatcaggtgcaatggctgatccacgggcatacccatcgcccggcggtgcatgaacttatcgccaatcagcaacctg Cttttcgcgtggtactgggtgcctggcatacggaaggttcaatggtgaaagtcacggcggatgacgttgagctgattcattttccgttttaaaaaac Ccgcaactttgctgatttcacagccacgcaaccgttttccttgctctctttccgtgctattctctgtgccctctaaagccgagagttgtgcaccaca Ggagttttaagacgcatgtcttcccgcaataatccggcgcgtgtcgccatcgtgatggggtccaaaagcgactgggctaccatgcagttcgccgccg aaatcttcgaaatcctga >pyrC Ttgttctgacaaacctgaccagccaaattggtcgcgaagagccgaataaggttaccctaaccggagacgccaatctggacatgaactccctgttcgg Tagtcagaaagcgaccatgaaactgaagctgaaagcgctgcccgtgtttgataaagaaaaaggtgcgatcttcctgaaagagatggaagtggtcgat Gcgacggtacaaccggaaaaaatgcaaacggtgatgcaaacgttgcttccctatttgaaccaggcattacgcaattactttaaccagcaacctgctt Acgtcctgcgcgaagatggcagccagggcgaagcaatggcgaaaaaactggcgaaaggcattgaagtgaagccaggcgaaattgtcattccatttac Tgattaatcacgagggcgcattcgcgccctttatttttcgtgcaaaggaaaacgtttccgcttatcctttgtgtccggcaaaaacatcccttcagcc Ggagcatagagattaatgactgcaccatcccaggtattaaagatccgccgcccagacgactggcaccttcacctccgcgatggcgacatgttaaaaa ctgtcgtgccatatacca >purR Catgacagcaatcacaaaaaaatgaaaataacaaaaagagaaaacacttttgccattttgctaacaaacaggaaggagatgcgagggagaacgcgct Ccctcgagaggaaatcagtgcagcgcggcagtcaaacccacggctacgatcaaaccgaggacgataatcgttgttaccagtgaaaatttaaggtcgg Tgctcatcaagttttctccttttttattaccacacaaaaagtgatattacgcatttttacacactgtgatgaaaaaatctcccgtcatttataatga Taagtgtttttaccacttccccttttcgtcaagatcggccaaaattccacgcttacactatttgcgtactggccattgaccccttcctgacgctccg Tgtcgtttttccggcgtaccgcaacacttttgttgtgcgtaaggtgtgtaaaggcaaacgtttaccttgcgattttgcaggagctgaagttagggtc Tggagtgaaatggaatggcaacaataaaagatgtagcgaaacgagcaaacgtttccactacaactgtgtcacacgtgatcaacaaaacacgtttcgt cgctgaagaaacgcgcaa >cvpA Gtaaagcctatgttgtgcaactgggtgcgctgaaaaatgccgataaagtgaatgagattgtcggtaagctgcgcggtgccggttatcgggtttatac Gtcgccatccacgccagtgcagggtaaaattacccgtattctggttgggccggatgcctcgaaagataagctgaaaggttcgctgggtgagttgaag Caactttctggcttaagtggcgtggtaatgggctatacgccgaattaatacggtcttgcctgatgcgacgctggcgcgtcttatcaggcctacgcag Gggtagaaccgtaggtcggataaggcgtttacgccgcatccgacacgcattgcccgatgccgcaaaggcataaaaagtcgatggcgttgaatatttt Ttcagcgccatttttattgatgcgcgggaaggaaatccctacgcaaacgttttctttttctgttagaatgcgccccgaacaggatgacagggcgtaa Aatcgtgggacacatatggtctggattgattacgccataatcgcggtgattgctttttcctctctggttagcctgatccgcggctttgttcgtgaag cgttatcgctggtgacat >purM Cgttccagccttcgatagttactttttccgtttcgaggtcggcggtcgcttcgtaagtcagcaggctacccacttcggaagcgagttcgcgaaagcg Cttggtgctgatatcttgctcacgcatcagtcccagcttgtgtttgacgagtgggtgtttgacttccacgatcttcatactctttctcctttgaggg Gcagccacaaaaaaaatcgacggattatacctcctttcttcaaggcggcaatattcttttcgttgactttagtcaaaatgataacggtttgagataa Agttattttatattcagatggttatgaaagaagattattccatccgaaaactaacctttaccctggcacaagtcttctttcgccgcgcgcctgggga Aaagacgtgcaaaaaggttgtgtaaagcagtctcgcaaacgtttgctttccctgttagaattgcgccgaattttatttttctaccgcaagtaacgcg Tggggacccaagcagtgaccgataaaacctctcttagctacaaagatgccggtgttgatattgacgcgggtaatgctctggttggaagaatcaaagg cgtagtgaagaaaacgcg >guaB Cttctgttgcagcagcccttcaccggccggctgcatactctcaacgattatctggtagtcgccgcgcggctcgtagagcgtaatattggcgcgaact Aaaacttgttgcccatgctgtgggcggaaggtcacccggcggttgctgttgcggaacatcgcgcagcgtacctgggcggtgtcgtctttgagtgtaa Agtaccagtgaccggaagctggttgcgtgaaattagaaatttcgccgctgatccaaacctgtcccatctcatgctcaagcagcagacgaaccgtttg Attcaggcgactaacggtaaaaattgcaggggattgagaaggtaacatgtgagcgagatcaaattctaaatcagcaggttattcagtcgatagtaac Ccgcccttcggggatagcaagcattttttgcaaaaaggggtagatgcaatcggttacgctctgtataatgccgcggcaatatttattaaccactctg Gtcgagatattgcccatgctacgtatcgctaaagaagctctgacgtttgacgacgttctcctcgttcctgctcactctaccgttctgccgaatactg ctgacctcagcacccagc >glnB Ttgtcagcctgaaaattccggcactggcggagcgcacagaagacattccgctactggcaaatcacctgttgcgccaggcggcagagcgacataaacc Gtttgtccgcgcgttctctaccgatgcgatgaaacgcctgatgaccgcgagctggccgggtaatgtgcgccagttggtcaacgtgattgaacagtgc Gtggcgctgacctcatctccggtgattagtgatgcgctggtggagcaggcgctggagggtgaaaatacggcgctgccaacctttgttgaggcacgta Atcagtttgaactcaactatttgcgtaagctgctgcaaatcaccaaaggcaacgtcacccacgcggcgagaatggcggggcgcaaccggacagaatt Ttataaactgctttcccgacacgagctggatgcaaacgatttcaaggaatgaattggcgttatgtgttacgtttagcagatcaaaagacaggcgacc Ttttcaaggaatagcatgaaaaagattgatgcgattataaaacccttcaagctggacgatgtccgcgaagcactggccgaagtcggtattaccggca tgacggtgaccgaagtga >purL Ttttacgccgaggtaatcggcaaactgtttcgccagttcgtaatccaggccaaaaggtttcccgttgatttcgttataagtcaggggagtatgaatg Gtgctcacacgcaactctccccgcgcttgaatggcggcgatacggttgtcggctttaccaaaccagggaatggatggccagagagcgaccgcgagca Gcagtgccagaatgccgatgaacagataattaatctttaattttttcaattagttaattctctgtgtcgtgcgcgtcccagcttgaaaaaacgtaat Aatagtgaaaggtttactcataaatgagcggcattttgcgtaaacctgcgccagatggcaacttattacagccattggcggcacgcgttgctaattc Acgatggtgattttatttccacgcaaacggtttcgtcagcgcatcagattctttataatgacgcccgtttcccccccttgggtacaccgaaagctta Gaagacgagagacttatgatggaaattctgcgtggttcgcctgcactgtcggcattccgaatcaacaaactgctggcacgttttcaggctgccaggc tcccggttcacaatattt >purA Atccgtagcctgcgtgcttatgagaacagcttctctggcaatcaggacgtgatggtcatgagcccggatagcgatttcttccgctacatgaagacgc Cgacttccgcaacgcgttaatataacgactgcggtacaggtcaataaagccaccgcatcctcagggatgtcggtggttttctttttctataaggata Atgaatgaattcgacaatctggctggcgcttgccctggttttggtactggaaggtttagggccgatgctttacccgaaggcatggaagaagatgatc Tctgcgatgaccaatttgcccgataatattttacgtcgttttggcggtggacttgtggttgcgggcgttgtggtctactacatgttgaggaaaacga Ttggctgaacaaaaaacagactgatcgaggtcatttttgagtgcaaaaagtgctgtaactctgaaaaagcgatggtagaatccatttttaagcaaac Ggtgattttgaaaaatgggtaacaacgtcgtcgtactgggcacccaatggggtgacgaaggtaaaggtaagatcgtcgatcttctgactgaacgggc taaatatgttgtacgcta >folD Cagcgcagacgaaataaatcttaatttcatatatattccttcaatctcatttatcgactccacatccgtatataaccgattactttatttaagacac Tgatagtagtaaattcctttttatcctctaagaatgtcttaattgaaaatatgcactctattctaaaaaatagagagccccgttagatgaatacttc Cgcgcaaaatatattcaacacaaatatagacctgaagcggtaaattaccaggctgaaaattctttttatattgtcaggtatttcttaaattatctta Atccttagacaaggaaataaatcagttccagatttacaacgccatcatggacgaaaaatgaagctttcagtctcagcgacggtgcgcctcaccttcg Caagaggtcgcttcacgcgataaatctgaaacgaaacctgacagcgcgccccgcttctgacaaaataggcgcatccccttcgatctacgtaacagat Ggaatcctctctctgatggcagcaaagattattgacggtaaaacgattgcgcagcaggtgcgctctgaagttgctcaaaaagttcaggcgcgtattg cagccggactgcgggcac >rpiA Ccgcgcgctcaaatcctcgttcacgtatcaccgcatccagtgcctgtaatgttctgtagtccgggcgtttcattgctgttgtctgctcctggtaaat Gctttttcctgcactatgacacaattttgtgtcaggttgcatataccgaagccgtcggcgggtaacatttgtatccgtggttaaaagcgcagcttaa Aagatcagggatttgcgctaatgcatttcgctcagcgagttcgcgccctggttgtgttgaatggcgtggcgttattgcctcaatttgcctgtaaaca Ggggcttgcgaacggtgaactggtgcgcctgtttgcaccgtggagcggcatacccagaccgttgtatgctttatttgcggggcgaaaggggatgcct Gccattgcgcgatattttatggatgagttaaccacgcggcttgccaacggggtctgaatcgctttttttgtatataatgcgtgtgaaatttcatacc Acaggcgaaacgatcatgacgcaggatgaattgaaaaaagcagtaggatgggcggcacttcagtatgttcagcccggcaccattgttggtgtaggta caggttccaccgccgcac >carA Gtctttttgatatgcgagatgtacttgatctcaataatttgtaaccacaaaatatttgttatggtgcaaaaataacacatttaatttattgattata Aagggctttaatttttggcccttttatttttggtgttatgtttttaaattgtctataagtgccaaaaattacatgttttgtcttctgtttttgttgt Tttaatgtaaattttgaccatttggtccacttttttctgctcgtttttatttcatgcaatcttcttgctgcgcaagcgttttccagaacaggttaga Tgatctttttgtcgcttaatgcctgtaaaacatgcatgagccacaaaataatataaaaaatcccgccattaagttgacttttagcgcccatatctcc Agaatgccgccgtttgccagaaattcgtcggtaagcagatttgcattgatttacgtcatcattgtgaattaatatgcaaataaagtgagtgaatatt Ctctggagggtgttttgattaagtcagcgctattggttctggaagacggaacccagtttcacggtcgggccataggggcaacaggttcggcggttgg ggaagtcgttttcaatac >pdhR Tgcgtgtgtaagtttgcaattccgtttgttgtattaatttgtttacatcaaagaagtttgaattgttacaaaaagacttccgtcagatcaagaataa Tggtatgcggcagcgaatgcacccgctttatgcatggttgaagatgagttgcttaaaaagaaaccgtttgtaaagctcagcctcaacccctctcaat Atgtagaatgaatttaaattcgttttaattgaattaaaaatcacaaaattggtaagtgaatcggttcaattcggatttttatagtttaataatcgtt Aaaaaactcctttcctacgtaaagtctacatttgtgcatagttacaactttgaaacgttatatatgtcaagttgttaaaatgtgcacagtttcatga Tttcaatcaaaacctgtatggacataaggtgaatactttgttactttagcgtcacagacatgaaattggtaagaccaattgacttcggcaagtggct Taagacaggaactcatggcctacagcaaaatccgccaaccaaaactctccgatgtgattgagcagcaactggagtttttgatcctcgaaggcactct ccgcccgggcgaaaaact >fixA Cgattattaacggcggaaagaaaaccttcggttctattcccgtttttctcttttcattcttcatgagttaattccactgtgaaaacgaatatttatt Ttgcgttcccgtttgttttatttttgttaacatttaatataattattattaacctcgtggacgcgttaatggctaactcataatgggtattcaataa Gctgtattctgtgattggtatcacatttttgtttcgggtgaatagagggcgttttttcgttaattttgattaataatcagtttgttatgctctgttg Tgagtaaaaaataacatctgactttcaatattggtgatccataaaacaatattgaaaatttctttttgctacgccgtgttttcaatattggtgagga Acttaacaatattgaaagttggatttatctgcgtgtgacattttcaatattggtgattaaagttttatttcaaaattaaagggcgtgatatctgtaa Ttaacaccaccgatatgaacgacgtttccttcatgatttctggagatgcaatgaagattattacttgctataagtgcgtgcctgatgaacaggatat tgcggtcaataatgctga >rbsD Attgcatgagcgggtcgattctgttaactctgcgcaccgaagacgctccatatgtccataacgtccgtcgggtacagattgaacaactgtcgcccac Tttctggcgcgtggtggcaagttatggttgcgagaaacgccaaacgtagaagaagttttccaccgctgcggtctggaaggattaagttgccggatga Tggaaacctccttctttatgtcgcatgagtcgttgatcctcgcaaacgcccgtggtatttgcgtctgcgcggcaagctgtacttgctgctgcaacgt Aatgcgctgcgtgcaccagatcaatttgaaatcccgccaaacagggttatcgaactgggtactcaggtcgaaatctaacgccagacgcctcctttct Tcataagggggcgtttttgttttcatggttaatcaccatgtaaaacgtttcgaggttgatcacatttccgtaacgtcacgatggttttcccaactca Gtcaggattaaactgtgggtcagcgaaacgtttcgctgatggagaaaaaaatgaaaaaaggcaccgttcttaattctgatatttcatcggtgatctc ccgtctgggacataccga >araB Ctgaccgcgaatggtgagattgagaatataacctttcattcccagcggtcggtcgataaaaaaatcgagataaccgttggcctcaatcggcgttaaa Cccgccaccagatgggcgttaaacgagtatcccggcagcaggggatcattttgcgcttcagccatacttttcatactcccaccattcagagaagaaa Ccaattgtccatattgcatcagacattgccgtcactgcgtcttttactggctcttctcgctaacccaaccggtaaccccgcttattaaaagcattct Gtaacaaagcgggaccaaagccatgacaaaaacgcgtaacaaaagtgtctataatcacggcagaaaagtccacattgattatttgcacggcgtcaca Ctttgctatgccatagcatttttatccataagattagcggatcctacctgacgctttttatcgcaactctctactgtttctccatacccgttttttt Ggatggagtgaaacgatggcgattgcaattggcctcgattttggcagtgattctgtgcgagctttggcggtggactgcgctaccggtgaagagatcg ccaccagcgtagagtggt >acnB Cagacacagccagttgtgtcgattgcggttccacaggcgcttccactgtgcggctttttatatatagcccggtagaggcggcacaaagcccggcact Gcaaattagcgccagcacatggggtttaaacggcaaagtcattttcataattcggatctcaaggaaatcgcaatggtcggcgaactgccacccgcag Gtgctgtgaatccgagtataaagaggcggtagtttaaattttgactaatcttgggattcgttgagaaaggtgattatcaccatgcgaattaacgaag Tttttacggagggaaacaatctctagaccatccttaacgattcagccacttttttatgttgcttttttgtaaacagattaacacctcgtcaaaatcc Tgctattctgcccgttgcggtactgggcatttaccctacaaactgctgtctcacaggagcgtgaagagaatcgcctgccgcactatgacaatgagag Cgaggagaaccgtcgtgctagaagaataccgtaagcacgtagctgagcgtgccgctgaggggattgcgcccaaacccctggatgcaaaccaaatggc cgcacttgtagagctgct Программа AlignACE 3.0 нашла только
один сайт, совпадающий с эксперементальным, в последосательности glnB. Программа MEME (One
per sequence)
нашла 2 сайта, совпадающих с эксперементальным. Программа MEME (Zero
or
one per sequence)
нашла 7 сайтов, совпадающих с . Задание №2. Поиск сайтов в
эукариотических последовательностях.
Выравнивание последовательностей A2_Human и
A2_Mouse, на котором размечены все найденные сайты:
>sequence1 Human:1-1000 (+) >sequence2 Mouse:47-991 (+)
000000001 GCCTCCTCAGGTACCCCCTGCCC----CCCACAGCTCCTCTCCTGTGCCTTGTTTCCCAG 000000056 >>>>>>>>> | |||||||||| || ||| |||| | | |||||||||| ||||| |||| || <<<<<<<<< 000000047 GTCTCCTCAGGTGCCTGGCTCCCAGTCCCCAGAACGCCTCTCCTGTACCTTGCTTCCTAG 000000106
000000057 C-----CATGCGTTCTCCTCTATAAATACCCGCTCTGGTATTTGGGGTTGGCAGCTGTTG 000000111 >>>>>>>>> | | | | |||||||||||||||||| |||||||||||| | ||||||||||||| <<<<<<<<< 000000107 CTGGGCCTTTCCTTCTCCTCTATAAATACCAGCTCTGGTATTTCGCCTTGGCAGCTGTTG 000000166
000000112 CTGCCAGGGAGATGGTTGGGTTGACATGCGGCTCCTGACAAAACACAAACCCCTGGTGTG 000000171 >>>>>>>>> |||| ||||||| || ||| ||||||||| ||||||||||||||||||||| ||||||| <<<<<<<<< 000000167 CTGCTAGGGAGACGGCTGGCTTGACATGCATCTCCTGACAAAACACAAACCCGTGGTGTG 000000226
000000172 TGTGGGCGTGGGTGGTGTGAGTAGGGGGATGAATCAGGGAGGGGGCGGGGGACCCAGGGG 000000231 >>>>>>>>> ||||| ||||| |||||||||||||||||||||||| ||||||||| |||| |||||| <<<<<<<<< 000000227 AGTGGGTGTGGGCGGTGTGAGTAGGGGGATGAATCAGAGAGGGGGCGAGGGAGACAGGGG 000000286
000000232 -GCAGGAGCCACACAAAGTCTGTGCGGGGGTGGGAGCGCACATAGCAATTGGAAACTGAA 000000290 >>>>>>>>> ||||||| || ||||| | |||||||||| || ||| ||| |||||||| | <<<<<<<<< 000000287 CGCAGGAGTCAGGCAAAGGCGATGCGGGGGTGCGACTACAC---GCAGTTGGAAACAG-- 000000341
000000291 AGCTTATCAGACCCTTTCTGGAAATCAGCCCACTGTTTATAAACTTGAGGCCCCACCCTC 000000350 >>>>>>>>> | ||||| ||||||||| | | ||| ||||||||||| <<<<<<<<< 000000342 ---TCGTCAGA-AGATTCTGGAAACTATCTTGCTGGCTATAAACTTGA------------ 000000385
000000351 GACAGTACCGGGGAGGAAGAGGGCCTGCACTAGTCCAGAGGGAAACTGAGGCTCAGGGCT 000000410 >>>>>>>>> |||| | ||| |||| || | ||| |||||||||||||||||| | | <<<<<<<<< 000000386 ----------GGGAAGCAGAAGGCCAACATTCCTCCCAAGGGAAACTGAGGCTCAGAGTT 000000435
000000411 AGCTCGCCCATA-----GACATACATGGCAGGCAGGCTTTGGCCAGGATCCCTCCGCCTG 000000465 >>>>>>>>> | | | || || || |||| || ||||||| || ||| ||| <<<<<<<<< 000000436 AAAACCCAGGTATCAGTGATATGCATG-------TGCCCCGGCCAGGGTCACTC--TCTG 000000486
000000466 CCAGGCGTCTCCCTGCCCTCCCTTCCTGCCTAGAGACCCCC--------ACCCTCAAG-C 000000516 >>>>>>>>> | | | ||| |||| | ||| ||||||||| | | | || | <<<<<<<<< 000000487 ACTAACCGGTACCTACCCTACAGGCCTACCTAGAGACTCTTTTGAAAGGATGGTAGAGAC 000000546
000000517 CTGGCTGGTCTTTGCCTGAGACCC----AAACCTCTTCGACTTCAAGAGAATATTTAGGA 000000572 >>>>>>>>> ||| | || ||||||| | ||||||| | ||| || || | | || <<<<<<<<< 000000547 CTGTCCGGGCTTTGCCCACAGTCGTTGGAAACCTCAGCATTTTCTAGGCAACTTGTGCGA 000000606
000000573 ACAAGGTGGTTTAGGG--CCTTTCCTGGGAACAGGCCTTGACCCTTTAAGAAATGACCCA 000000630 >>>>>>>>> | || || ||| |||| |||| | || ||| ||| | <<<<<<<<< 000000607 ATAAAACACTTCGGGGGTCCTT--------------CTTGTTCATT---CCAATAACCTA 000000649
000000631 AAGTCTCTCCTTGACCAAAAAGGGGACCCTCAAACTAAAGGGAAGCCTCTCTTCTGCTGT 000000690 >>>>>>>>> || ||||||| | |||| ||| |||||||| ||| | || |||| | ||| | <<<<<<<<< 000000650 AAACCTCTCCTCGGAGAAAATAGGGGGCCTCAAAC-AAACGAAATTCTCTAGCCCGCTTT 000000708
000000691 CTCCCCTGACCCCACTCCCCCCCACCCCAGGACGAGG-AGATAACCA---GGGCTGAAAG 000000746 >>>>>>>>> |||||||| ||| || | ||| || |||| <<<<<<<<< 000000709 ------------------------CCCCAGGATAAGGCAGGCATCCAAATGGAAAAAAAG 000000744
000000747 AGGCCCGCCTGGGGGCTGCAGACATGCTTGCTGCCTGCCCTGGCGAAGGATTGGCAGGCT 000000806 >>>>>>>>> |||| ||| |||| || | | || ||| | ||||||| || |||||| <<<<<<<<< 000000745 GGGCCGGCCGGGGGTCTCCTGTCA-----GCTCCTTGCCCTGTGAAA--CCCAGCAGGCC 000000797
000000807 TGCCCGTCACAGGACCCCCGCTGGCTGACTCAGGGGCGCAGGCCTCTTGCGGGGGAGCTG 000000866 >>>>>>>>> |||| ||| | || | ||||| | |||||||||||||||||||||||||||||| <<<<<<<<< 000000798 TGCCTGTCTTCTGTCCTCTTGGGGCTGTC-CAGGGGCGCAGGCCTCTTGCGGGGGAGCTG 000000856
000000867 GCCTCCCCGCCCCCACGGCCACGGGCCGCCCTTTCCTGGCAGGACAGCGGGATCTTGCAG 000000926 >>>>>>>>> |||||||||||||| || | || | || |||||||||||||||| |||||| ||||| <<<<<<<<< 000000857 GCCTCCCCGCCCCCTCGCCTGTGGCCGCCCTTTTCCTGGCAGGACAGAGGGATCCTGCAG 000000916
000000927 CTGTCAGGGGAGGGGAGGCGGGGGCTGATGTCAGGAGGGATACAAATAGTGCCGACGGCT 000000986 >>>>>>>>> ||||||||||||||| | |||||| |||||||||||||| |||||||||||| ||| ||| <<<<<<<<< 000000917 CTGTCAGGGGAGGGGCGCCGGGGGGTGATGTCAGGAGGGCTACAAATAGTGCAGACAGCT 000000976
000000987 G-GGGGCCCTGTCTC 0000001000 >>>>>>>>> ||||| | ||| | <<<<<<<<< 000000977 AAGGGGCTCCGTCAC 000000991
Синим цветом выделены сайты для транскрипционного фактора AP2. Фиолетовым цветом выделен сайт для транскрипционного фактора SRF. Зеленым цветом выделен сайт для транскрипционного фактора GATA1. Результаты расчета, на сколько нуклеотидов
приходится один сайт.
Поделил среднюю
длину одной пары последовательностей на суммарное число всех
найденных сайтов (12).
((1000+944)/2)/12 = 80,08
На какое число нуклеотидов в среднем
приходился бы один сайт если бы мне необходимо было найти сайты для всех
407 факторов, имеющихся в арсенале
программы rVISTA.
Чтобы узнать это,
разделил полученное значение на 50.
80,08/50 = 1,616
Выравнивание последовательностей В2_Human и В2_Mouse, на котором размечены все найденные сайты:
>sequence1 Human:1-484 (+) >sequence2 Mouse:1-531 (+)
000000001 CTCTCGCCTTCTGGGGTGG-GGGGTCCCGTC----------------------------- 000000030 >>>>>>>>> | | ||||||| ||| | ||||| || | <<<<<<<<< 000000001 CGCAGGCCTTCTTTGGTCGAGGGGTGTCGACTTTAGACCACAGAGCTTGCTCAGCATCAC 000000060
000000031 ------CTTTCCCCCACTGAGG-------ACAGAGGCCCGCCCAGCGATCTGAGCATGTG 000000077 >>>>>>>>> ||| |||| |||| | || | || || || || ||||| || <<<<<<<<< 000000061 TGATGCCTTCCCCCAACTGTGTGGCCTGCACCGCCTGCCTCCGAGTGAGTGGAGCACGT- 000000119
000000078 TGGACGTCAATCTTGCAGCCCCTCTTCCAGGCCCCCTCCCCAGCCTTGCAGGGCTCAGGT 000000137 >>>>>>>>> |||| |||||||||||| | | ||||||||||| ||||| |||||||||||||| <<<<<<<<< 000000120 -----GTCAGTCTTGCAGCCCCCTTCCTAGGCCCCCTCCTCAGCC-TGCAGGGCTCAGGT 000000173
000000138 TACCCCTGGCCTTTCCTAAAGGTCACTCATTCCTCTTGA-CGTTTGCAAAAGGGGAATGT 000000196 >>>>>>>>> ||||||||||||||| ||||| |||| |||||||| | | ||||||| || ||||||| <<<<<<<<< 000000174 TACCCCTGGCCTTTCTAAAAGGGCACTGGTTCCTCTTTAACCTTTGCAAGAGTGGAATGT 000000233
000000197 AATCCTGGGGTGGGGGGAGACCC-CTCATCTGTAGCCCCTCCCTTGCTCCTCCCAAAGGG 000000255 >>>>>>>>> || | | |||| |||||| | |||| | | || ||| | ||| |||||||| | <<<<<<<<< 000000234 AAGTTT---GAGGGGAAAGACCCTCCCATCAGAAACCTCTCTCCAGCT-TTCCCAAAGAG 000000289
000000256 TGGAATTAGAAC-AGGGACTGTTATTGGGAGACAGAAAGTGG-------GGGATAGTAGT 000000307 >>>>>>>>> || | | || || |||| |||||||| ||||||||| | |||| ||| <<<<<<<<< 000000290 TGAACCTCAAAGTAGAGACTTTTATTGGGGGACAGAAAGAGAATGCATAGGGACAGTCAG 000000349
000000308 TGACCTTTGGTAAGGGGGCAG--------GTGCCCAGGGCCAGAGGCTTCTGCTTCAGGC 000000359 >>>>>>>>> | | |||| ||||||| | | |||| || ||| |||| |||||| ||| <<<<<<<<< 000000350 TAGCTTTTGAGAAGGGGGTACACGCCCCAGGGCCCCAGGTCAGGAGCTTTTGCTTCGGGC 000000409
000000360 TGTAGTGGGCACTTGGCTGCCAGCCCAGTGTGAAGGGG-GGAGGATGGAGAGAAAGAGAG 000000418 >>>>>>>>> || |||||||||||||||||| ||| |||| ||||| |||||||||| | |||||| <<<<<<<<< 000000410 TGCAGTGGGCACTTGGCTGCCTGCC---TGTGGAGGGGAGGAGGATGGAATG--AGAGAG 000000464
000000419 GCGGGGCTGGCTGGGG-ACCGAGTGGCTCAGGGATAAATGCGCAGCCTGAGAGGGGGTGA 000000477 >>>>>>>>> |||||||||||||||| || | |||||| | ||||||||| ||| |||||||||||||| <<<<<<<<< 000000465 GCGGGGCTGGCTGGGGGACAGGGTGGCTTGGAGATAAATGCCCAGTCTGAGAGGGGGTGA 000000524
000000478 GCTGACA 000000484 >>>>>>>>> |||||| <<<<<<<<< 000000525 ACTGACA 000000531
Синим цветом выделены сайты для транскрипционного фактора AP2. Темно-красным толстым выделен сайт для транскрипционного фактора MYOD. Красным цветом выделен сайт для транскрипционного фактора TEF1. Зелным толстым выделены сайты для транскрипционного фактора GATA1. Оранжевым толстым выделен сайт для транскрипционного фактора MEF3. Желтым толстым выделен сайт для транскрипционного фактора SRF.
Результаты расчета, на сколько нуклеотидов в
среднем приходится один сайт.
Поделил среднюю
длину одной пары последовательностей на суммарное число всех
найденных сайтов (11).
((484+ 531)/2)/11)
= 46.13 На какое число нуклеотидов в среднем
приходился бы один сайт если бы мне необходимо было найти сайты для всех 407
факторов, имеющихся в арсенале программы rVISTA. Чтобы узнать это,
разделил полученное значение на 50. 46.13/50 = 0.92 |
На главную страницу
третьего семестра
© Кузеванов Алексей,2005