Отчет студента 2 курса ФББ Кузеванова Алексея Владимировича по работе

«Поиск регуляторных сигналов».


Задание №1. Поиск сигналов регуляции транскрипции в бактериальных последовательностях.

AlignACE 3.0

Я получил вариант, в котором содержится 18 последовательностей.

При первой попытке поиска сигнала я устанавливил Number of sites to expect равным 18.

Поскольку не удалось сразу же получить разницу весов между первым и вторым наборов сайтов

в 1,5 раза, то производил повторные попытки поиска сигнала, но уже с меньшими значениями

Number of sites to expect. Ни при одном значении Number of sites to expect не удалось

обнаружить  наилучшего набора сайтов, поэтому за наилучший выбрал тот набор, вес которого

максимален среди всех первых наборов сайтов для различных значений Number of sites to expect.

Значение этого параметра - 18.

 

Результаты:

 

AlignACE 3.0 04/13/02
/usr/jhughes/bin/AlignACE -i /home/alignace/notgiven-24181.seq -numcols 16 -expect 18 -gcback 0.38 
Parameter values:
 expect =       18
 gcback =       0.38
 minpass =      200
 seed =         1166220075
 numcols =      16
 undersample =  1
 oversample =  1

Input sequences:
#0 codB
#1 purE
#2 pyrC
#3 purR
#4 cvpA
#5 purM
#6 guaB
#7 glnB
#8 purL
#9 purA
#10 folD

#11 rpiA
#12 carA
#13 pdhR
#14 fixA
#15 rbsD
#16 araB
#17 acnB

Motif 1
CAGAAGCGGGGCGCGCTGTCAGGTTTCG 10 419 0
CATTGGCGGCACGCGTTGCTAATTCACG 8 363 1
CAGATGCCTGATGCGACGCTGACGCGTC 0 306 1
GATGTCCGCGAAGCACTGGCCGAAGTCG 7 542 1
CGACCGCGAGCAGCAGTGCCAGAATGCC 8 182 1
CTGGATCGTGCGGCGCAGCATTTTTCCG 0 52 0
CGATGGCGACACGCGCCGGATTATTGCG 1 509 0
CGGATGCGTCGCGCGGTGCATCCGGCAC 0 178 1
CTTTCCCGACACGAGCTGGATGCAAACG 7 398 1
CAGATCCGCCAGGCGATGGAAGAGTAGG 0 143 1
GAGCCGCGCGGCGACTACCAGATAATCG 6 44 0

CTTTCGCCGCGCGCCTGGGGAAAAGACG 5 367 1
CGGATGCGACGCGAGCGCCTTATCCGAC 0 268 0
GTCTTGCCTGATGCGACGCTGGCGCGTC 4 246 1
GGTTAGCGAGAAGAGCCAGTAAAAGACG 16 231 0
CTGAAGCTGAAAGCGCTGCCCGTGTTTG 2 119 1
GATTTCGGCGGCGAACTGCATGGTAGCC 1 559 0
GGTCAGCGCCACGCACTGTTCAATCACG 7 178 0
CAGGAGCGTGAAGAGAATCGCCTGCCGC 17 441 1
CTTTAGCCAGGGGCCAGTCCCGCAGTCG 0 516 1
CGGCAGGGCGAGGAATAGCGTCTGCAGC 1 67 0
GCTATCCCCGAAGGGCGGGTTACTATCG 6 378 0
CTGCCGCCTGGCGCAACAGGTGATTTGC 7 56 0
CTGCAACGTAATGCGCTGCGTGCACCAG 15 282 1
CGCATCCGACACGCATTGCCCGATGCCG 4 325 1
CAAGCGCGGGGAGAGTTGCGTGTGAGCA 8 98 0

CAGGAAGGAGATGCGAGGGAGAACGCGC 3 68 1
ATGCACCGCCGGGCGATGGGTATGCCCG 1 238 0
CGGTAGCGCAGTCCACCGCCAAAGCTCG 16 542 0
GTGCAACTGGGTGCGCTGAAAAATGCCG 4 14 1
CACTGGCGGAGCGCACAGAAGACATTCC 7 21 1
GAAACGCCTGATGACCGCGAGCTGGCCG 7 127 1
GTGATTAGTGATGCGCTGGTGGAGCAGG 7 215 1
GCGGGGCGAAAGGGGATGCCTGCCATTG 11 367 1
GCGAATGCGCGCGAACAGCAAAGAAGCC 1 121 1
GCGGTTCCACAGGCGCTTCCACTGTGCG 17 24 1
CCGATGCCTGATGCGACGCTGACGCGTT 0 212 1
GGGTAGCCTGCTGACTTACGAAGCGACC 5 43 0
GTTGGGCCGGATGCCTCGAAAGATAAGC 4 140 1
CGCCGCCCAGACGACTGGCACCTTCACC 2 530 1
ACGGAGCGTCAGGAAGGGGTCAATGGCC 3 361 0

CCGCAACGGGCAGAATAGCAGGATTTTG 17 380 0
ACGCGGCGAGAATGGCGGGGCGCAACCG 7 351 1
CAGCCGGCCGGTGAAGGGCTGCTGCAAC 6 5 0
GCTGAGCGTGCCGCTGAGGGGATTGCGC 17 526 1
CCTTCGGGTAAAGCATCGGCCCTAAACC 9 246 0
GTAACGCGTGGGGACCCAAGCAGTGACC 5 477 1
GAAGTGGTCGATGCGACGGTACAACCGG 2 182 1
CCTTTTCGTCAAGATCGGCCAAAATTCC 3 311 1
GAACCGGGAGCCTGGCAGCCTGAAAACG 8 563 0
CACCGCCCAGGTACGCTGCGCGATGTTC 6 150 0
CTGTTACGTAGATCGAAGGGGATGCGCC 10 455 0
TGGCCGCCCGGCGCACGTCTGGTTTGTC 0 1 1
GTGGTACTGGGTGCCTGGCATACGGAAG 1 299 1
AGAATGCGCCCCGAACAGGATGACAGGG 4 452 1
CAACCGCCGGGTGACCTTCCGCCCACAG 6 114 0

CTGCTGCCGGGATACTCGTTTAACGCCC 16 110 0
TGCGTGCCTGATGAACAGGATATTGCGG 14 559 1
CACTGGCGTGGATGGCGACGTATAAACC 4 88 0
GTACAGCTTGCCGCGCAGACGCAAATAC 15 248 0
CTGGCGCGTGGTGGCAAGTTATGGTTGC 15 100 1
GCGGTGGTCAGTGCGATGGAAAAACATC 1 191 1
GCAAACGGTGATGCAAACGTTGCTTCCC 2 217 1
GTCGTGCTAGAAGAATACCGTAAGCACG 17 496 1
GCAATGGTCGGCGAACTGCCACCCGCAG 17 166 1
CCTTGGCGCGAAAAGCCTGATAACCCGC 1 26 0
GAAATCAGTGCAGCGCGGCAGTCAAACC 3 107 1
GCTGAGCGAAATGCATTAGCGCAAATCC 11 202 0
CTTGTGCCAGGGTAAAGGTTAGTTTTCG 5 335 0
GAGATTGTCGGTAAGCTGCGCGGTGCCG 4 53 1
CTTCCGCTACATGAAGACGCCGACTTCC 9 77 1

CAATAACGCCACGCCATTCAACACAACC 11 243 0
GGAATGCCGACAGTGCAGGCGAACCACG 8 515 0
GCACAAAGCCCGGCACTGCAAATTAGCG 17 80 1
* *  *** ** **** **  *    **
MAP Score: 95.2303

Таким образом, программа нашла 73 сайта.

 

 

Обратно-комплементарные сайты:

 

CAGAAGCGGGGCGCGCTGTCAGGTTTCG 10 419 0
cgaaacctgacagcgcgccccgcttctg

CTGGATCGTGCGGCGCAGCATTTTTCCG 0 52 0
cggaaaaatgctgcgccgcacgatccag

CGATGGCGACACGCGCCGGATTATTGCG 1 509 0
cgcaataatccggcgcgtgtcgccatcg

GAGCCGCGCGGCGACTACCAGATAATCG 6 44 0
cgattatctggtagtcgccgcgcggctc

CGGATGCGACGCGAGCGCCTTATCCGAC 0 268 0
gtcggataaggcgctcgcgtcgcatccg

GGTTAGCGAGAAGAGCCAGTAAAAGACG 16 231 0
cgtcttttactggctcttctcgctaacc

GATTTCGGCGGCGAACTGCATGGTAGCC 1 559 0
ggctaccatgcagttcgccgccgaaatc

GGTCAGCGCCACGCACTGTTCAATCACG 7 178 0
cgtgattgaacagtgcgtggcgctgacc

CGGCAGGGCGAGGAATAGCGTCTGCAGC 1 67 0
gctgcagacgctattcctcgccctgccg

GCTATCCCCGAAGGGCGGGTTACTATCG 6 378 0
cgatagtaacccgcccttcggggatagc

CTGCCGCCTGGCGCAACAGGTGATTTGC 7 56 0
gcaaatcacctgttgcgccaggcggcag

CAAGCGCGGGGAGAGTTGCGTGTGAGCA 8 98 0
tgctcacacgcaactctccccgcgcttg

ATGCACCGCCGGGCGATGGGTATGCCCG 1 238 0
cgggcatacccatcgcccggcggtgcat

CGGTAGCGCAGTCCACCGCCAAAGCTCG 16 542 0
cgagctttggcggtggactgcgctaccg

GGGTAGCCTGCTGACTTACGAAGCGACC 5 43 0
ggtcgcttcgtaagtcagcaggctaccc

ACGGAGCGTCAGGAAGGGGTCAATGGCC 3 361 0
ggccattgaccccttcctgacgctccgt

CCGCAACGGGCAGAATAGCAGGATTTTG 17 380 0
caaaatcctgctattctgcccgttgcgg

CAGCCGGCCGGTGAAGGGCTGCTGCAAC 6 5 0
gttgcagcagcccttcaccggccggctg

CCTTCGGGTAAAGCATCGGCCCTAAACC 9 246 0
ggtttagggccgatgctttacccgaagg

GAACCGGGAGCCTGGCAGCCTGAAAACG 8 563 0
cgttttcaggctgccaggctcccggttc

CACCGCCCAGGTACGCTGCGCGATGTTC 6 150 0
gaacatcgcgcagcgtacctgggcggtg

CTGTTACGTAGATCGAAGGGGATGCGCC 10 455 0
ggcgcatccccttcgatctacgtaacag

CAACCGCCGGGTGACCTTCCGCCCACAG 6 114 0
ctgtgggcggaaggtcacccggcggttg

CTGCTGCCGGGATACTCGTTTAACGCCC 16 110 0
gggcgttaaacgagtatcccggcagcagg

CACTGGCGTGGATGGCGACGTATAAACC 4 88 0
ggtttatacgtcgccatccacgccagtg

GTACAGCTTGCCGCGCAGACGCAAATAC 15 248 0
gtatttgcgtctgcgcggcaagctgtac

CCTTGGCGCGAAAAGCCTGATAACCCGC 1 26 0
gcgggttatcaggcttttcgcgccaagg

GCTGAGCGAAATGCATTAGCGCAAATCC 11 202 0
ggatttgcgctaatgcatttcgctcagc

CTTGTGCCAGGGTAAAGGTTAGTTTTCG 5 335 0
cgaaaactaacctttaccctggcacaag

CAATAACGCCACGCCATTCAACACAACC 11 243 0
ggttgtgttgaatggcgtggcgttattg

GGAATGCCGACAGTGCAGGCGAACCACG 8 515 0
cgtggttcgcctgcactgtcggcattcc

 

 MEME (One per sequence)

 

NAME

 

STRAND

 

START

 

P-VALUE

 

 

 

 

 

SITES

 

purR

 

+

 

442

 

2.82e-09

 

GTGTGTAAAG

 

G

C

A

A

A

C

G

T

T

T

A

C

C

T

T

G

 

 

CGATTTTGCA

cvpA

 

+

 

431

 

8.43e-09

 

AAATCCCTAC

 

G

C

A

A

A

C

G

T

T

T

T

C

T

T

T

T

 

 

TCTGTTAGAA

purE

 

+

 

416

 

2.46e-08

 

TCACAGCCAC

 

G

C

A

A

C

C

G

T

T

T

T

C

C

T

T

G

 

 

CTCTCTTTCC

codB

 

-

 

416

 

4.79e-08

 

AAGATAAAAA

 

G

C

A

A

T

C

G

T

T

T

T

C

G

T

G

G

 

 

GGAAATATAT

pyrC

 

-

 

432

 

5.59e-08

 

AAGGATAAGC

 

G

G

A

A

A

C

G

T

T

T

T

C

C

T

T

T

 

 

GCACGAAAAA

purL

 

+

 

411

 

2.30e-07

 

TTATTTCCAC

 

G

C

A

A

A

C

G

G

T

T

T

C

G

T

C

A

 

 

GCGCATCAGA

purM

 

+

 

423

 

2.30e-07

 

AAGCAGTCTC

 

G

C

A

A

A

C

G

T

T

T

G

C

T

T

T

C

 

 

CCTGTTAGAA

purA

 

-

 

377

 

5.17e-07

 

TTTTGTTCAG

 

C

C

A

A

T

C

G

T

T

T

T

C

C

T

C

A

 

 

ACATGTAGTA

carA

 

+

 

266

 

5.67e-07

 

TTCTTGCTGC

 

G

C

A

A

G

C

G

T

T

T

T

C

C

A

G

A

 

 

ACAGGTTAGA

pdhR

 

-

 

153

 

8.47e-07

 

GCTGAGCTTT

 

A

C

A

A

A

C

G

G

T

T

T

C

T

T

T

T

 

 

TAAGCAACTC

folD

 

-

 

520

 

1.45e-06

 

CACCTGCTGC

 

G

C

A

A

T

C

G

T

T

T

T

A

C

C

G

T

 

 

CAATAATCTT

glnB

 

+

 

420

 

2.59e-06

 

CGAGCTGGAT

 

G

C

A

A

A

C

G

A

T

T

T

C

A

A

G

G

 

 

AATGAATTGG

guaB

 

+

 

434

 

2.59e-06

 

AGGGGTAGAT

 

G

C

A

A

T

C

G

G

T

T

A

C

G

C

T

C

 

 

TGTATAATGC

rbsD

 

-

 

425

 

4.43e-06

 

TGATCAACCT

 

C

G

A

A

A

C

G

T

T

T

T

A

C

A

T

G

 

 

GTGATTAACC

araB

 

-

 

66

 

6.35e-06

 

GCCGATTGAG

 

G

C

C

A

A

C

G

G

T

T

A

T

C

T

C

G

 

 

ATTTTTTTAT

fixA

 

-

 

16

 

8.90e-06

 

GGGAATAGAA

 

C

C

G

A

A

G

G

T

T

T

T

C

T

T

T

C

 

 

CGCCGTTAAT

rpiA

 

+

 

299

 

1.47e-05

 

ACAGGGGCTT

 

G

C

G

A

A

C

G

G

T

G

A

A

C

T

G

G

 

 

TGCGCCTGTT

acnB

 

-

 

451

 

5.84e-05

 

TCATAGTGCG

 

G

C

A

G

G

C

G

A

T

T

C

T

C

T

T

C

 

 

ACGCTCCTGT

 

Обратно-комплементарные сайты :

codB 416 GCAATCGTTTTCGTGG

         ccacgaaaacgattgc

pyrC 432 GGAAACGTTTTCCTTT

         aaaggaaaacgtttcc

purA 377 CCAATCGTTTTCCTCA

         tgaggaaaacgattgg

pdhR 153 ACAAACGGTTTCTTTT

         aaaagaaaccgtttgt

folD 520 GCAATCGTTTTACCGT

         acggtaaaacgattgc

rbsD 425 CGAAACGTTTTACATG

         catgtaaaacgtttcg

araB 66  GCCAACGGTTATCTCG

         cgagataaccgttggc

fixA 16  CCGAAGGTTTTCTTTC

         gaaagaaaaccttcgg

acnB 451 GCAGGCGATTCTCTTC

         gaagagaatcgcctgc

 

 

 

MEME (Zero or one per sequence)

NAME

 

STRAND

 

START

 

P-VALUE

 

 

 

 

 

SITES

 

cvpA

 

-

 

430

 

1.78e-09

 

TCTAACAGAA

 

A

A

A

G

A

A

A

A

C

G

T

T

T

G

C

G

 

 

TAGGGATTTC

pyrC

 

+

 

433

 

1.45e-08

 

TTTTCGTGCA

 

A

A

G

G

A

A

A

A

C

G

T

T

T

C

C

G

 

 

CTTATCCTTT

purE

 

-

 

415

 

1.60e-08

 

GAAAGAGAGC

 

A

A

G

G

A

A

A

A

C

G

G

T

T

G

C

G

 

 

TGGCTGTGAA

purR

 

-

 

441

 

4.26e-08

 

GCAAAATCGC

 

A

A

G

G

T

A

A

A

C

G

T

T

T

G

C

C

 

 

TTTACACACC

purL

 

-

 

410

 

4.84e-08

 

CTGATGCGCT

 

G

A

C

G

A

A

A

C

C

G

T

T

T

G

C

G

 

 

TGGAAATAAA

purM

 

-

 

422

 

9.02e-08

 

TCTAACAGGG

 

A

A

A

G

C

A

A

A

C

G

T

T

T

G

C

G

 

 

AGACTGCTTT

codB

 

+

 

417

 

1.60e-07

 

TATATTTCCC

 

C

A

C

G

A

A

A

A

C

G

A

T

T

G

C

T

 

 

TTTTATCTTC

carA

 

-

 

265

 

1.99e-07

 

CTAACCTGTT

 

C

T

G

G

A

A

A

A

C

G

C

T

T

G

C

G

 

 

CAGCAAGAAG

folD

 

+

 

521

 

2.22e-07

 

AGATTATTGA

 

C

G

G

T

A

A

A

A

C

G

A

T

T

G

C

G

 

 

CAGCAGGTGC

purA

 

+

 

378

 

3.31e-07

 

ACTACATGTT

 

G

A

G

G

A

A

A

A

C

G

A

T

T

G

G

C

 

 

TGAACAAAAA

pdhR

 

+

 

154

 

7.67e-07

 

AGTTGCTTAA

 

A

A

A

G

A

A

A

C

C

G

T

T

T

G

T

A

 

 

AAGCTCAGCC

guaB

 

-

 

433

 

1.89e-06

 

CATTATACAG

 

A

G

C

G

T

A

A

C

C

G

A

T

T

G

C

A

 

 

TCTACCCCTT

rbsD

 

+

 

426

 

3.14e-06

 

GTTAATCACC

 

A

T

G

T

A

A

A

A

C

G

T

T

T

C

G

A

 

 

GGTTGATCAC

glnB

 

-

 

419

 

4.11e-06

 

CAATTCATTC

 

C

T

T

G

A

A

A

T

C

G

T

T

T

G

C

A

 

 

TCCAGCTCGT

araB

 

+

 

491

 

6.04e-06

 

TTTTTGGATG

 

G

A

G

T

G

A

A

A

C

G

A

T

G

G

C

G

 

 

ATTGCAATTG

fixA

 

+

 

17

 

1.08e-05

 

TTAACGGCGG

 

A

A

A

G

A

A

A

A

C

C

T

T

C

G

G

T

 

 

TCTATTCCCG

rpiA

 

-

 

298

 

1.47e-05

 

ACAGGCGCAC

 

C

A

G

T

T

C

A

C

C

G

T

T

C

G

C

A

 

 

AGCCCCTGTT

 

Обратно-комплементарные сайты :

 

cvpA 430 AAAGAAAACGTTTGCG

         cgcaaacgttttcttt

purE 415 AAGGAAAACGGTTGCG

         cgcaaccgttttcctt

purR 441 AAGGTAAACGTTTGCC

         ggcaaacgtttacctt

purL 410 GACGAAACCGTTTGCG

         cgcaaacggtttcgtc

purM 422 AAAGCAAACGTTTGCG

         cgcaaacgtttgcttt

carA 265 CTGGAAAACGCTTGCG

         cgcaagcgttttccag

guaB 433 AGCGTAACCGATTGCA

         tgcaatcggttacgct

glnB 419 CTTGAAATCGTTTGCA

         tgcaaacgatttcaag

rpiA 298 CAGTTCACCGTTCGCA

         tgcgaacggtgaactg

 

 

>codB

Ttggccgcccggcgcacgtctggtttgtctcgcaattgccaaaaacgcgatccggaaaaatgctgcgccgcacgatccaggcgatttgcgaaggacg

Cgatcctggagatctgacgaccattgatgatcctgcgtcgttggatcagatccgccaggcgatggaagagtaggttattgtcggatgcgtcgcgcgg

Tgcatccggcactgtgtgccgatgcctgatgcgacgctgacgcgttttatcatgcctacggacctgaaccgtaggtcggataaggcgctcgcgtcgc

Atccgacaccatgctcagatgcctgatgcgacgctgacgcgtcttatcaggcctacccactgtttttacaccgataatttttcccccacctttttgc

Actcattcatataaaaaatatatttccccacgaaaacgattgctttttatcttcagatgaatagaatgcggcggattttttgggtttcaaacagcaa

Aaagggggaatttcgtgtcgcaagataacaactttagccaggggccagtcccgcagtcggcgcggaaaggggtattggcattgacgttcgtcatgct

gggattaaccttcttttc

 

>purE

Atggcgacacgctgtgcaccgatgacgcgggttatcaggcttttcgcgccaaggtccacaaaccctggctgcagacgctattcctcgccctgccgtt

Gtttgtgcgcaaacgcattgccgcgcgaatgcgcgcgaacagcaaagaagccaacagcagtaaatcgctggcgatcatggacgttaaccaaaacgcg

Gtggtcagtgcgatggaaaaacatcaggtgcaatggctgatccacgggcatacccatcgcccggcggtgcatgaacttatcgccaatcagcaacctg

Cttttcgcgtggtactgggtgcctggcatacggaaggttcaatggtgaaagtcacggcggatgacgttgagctgattcattttccgttttaaaaaac

Ccgcaactttgctgatttcacagccacgcaaccgttttccttgctctctttccgtgctattctctgtgccctctaaagccgagagttgtgcaccaca

Ggagttttaagacgcatgtcttcccgcaataatccggcgcgtgtcgccatcgtgatggggtccaaaagcgactgggctaccatgcagttcgccgccg

aaatcttcgaaatcctga

 

>pyrC

Ttgttctgacaaacctgaccagccaaattggtcgcgaagagccgaataaggttaccctaaccggagacgccaatctggacatgaactccctgttcgg

Tagtcagaaagcgaccatgaaactgaagctgaaagcgctgcccgtgtttgataaagaaaaaggtgcgatcttcctgaaagagatggaagtggtcgat

Gcgacggtacaaccggaaaaaatgcaaacggtgatgcaaacgttgcttccctatttgaaccaggcattacgcaattactttaaccagcaacctgctt

Acgtcctgcgcgaagatggcagccagggcgaagcaatggcgaaaaaactggcgaaaggcattgaagtgaagccaggcgaaattgtcattccatttac

Tgattaatcacgagggcgcattcgcgccctttatttttcgtgcaaaggaaaacgtttccgcttatcctttgtgtccggcaaaaacatcccttcagcc

Ggagcatagagattaatgactgcaccatcccaggtattaaagatccgccgcccagacgactggcaccttcacctccgcgatggcgacatgttaaaaa

ctgtcgtgccatatacca

 

>purR

Catgacagcaatcacaaaaaaatgaaaataacaaaaagagaaaacacttttgccattttgctaacaaacaggaaggagatgcgagggagaacgcgct

Ccctcgagaggaaatcagtgcagcgcggcagtcaaacccacggctacgatcaaaccgaggacgataatcgttgttaccagtgaaaatttaaggtcgg

Tgctcatcaagttttctccttttttattaccacacaaaaagtgatattacgcatttttacacactgtgatgaaaaaatctcccgtcatttataatga

Taagtgtttttaccacttccccttttcgtcaagatcggccaaaattccacgcttacactatttgcgtactggccattgaccccttcctgacgctccg

Tgtcgtttttccggcgtaccgcaacacttttgttgtgcgtaaggtgtgtaaaggcaaacgtttaccttgcgattttgcaggagctgaagttagggtc

Tggagtgaaatggaatggcaacaataaaagatgtagcgaaacgagcaaacgtttccactacaactgtgtcacacgtgatcaacaaaacacgtttcgt

cgctgaagaaacgcgcaa

 

>cvpA

Gtaaagcctatgttgtgcaactgggtgcgctgaaaaatgccgataaagtgaatgagattgtcggtaagctgcgcggtgccggttatcgggtttatac

Gtcgccatccacgccagtgcagggtaaaattacccgtattctggttgggccggatgcctcgaaagataagctgaaaggttcgctgggtgagttgaag

Caactttctggcttaagtggcgtggtaatgggctatacgccgaattaatacggtcttgcctgatgcgacgctggcgcgtcttatcaggcctacgcag

Gggtagaaccgtaggtcggataaggcgtttacgccgcatccgacacgcattgcccgatgccgcaaaggcataaaaagtcgatggcgttgaatatttt

Ttcagcgccatttttattgatgcgcgggaaggaaatccctacgcaaacgttttctttttctgttagaatgcgccccgaacaggatgacagggcgtaa

Aatcgtgggacacatatggtctggattgattacgccataatcgcggtgattgctttttcctctctggttagcctgatccgcggctttgttcgtgaag

cgttatcgctggtgacat

 

>purM

Cgttccagccttcgatagttactttttccgtttcgaggtcggcggtcgcttcgtaagtcagcaggctacccacttcggaagcgagttcgcgaaagcg

Cttggtgctgatatcttgctcacgcatcagtcccagcttgtgtttgacgagtgggtgtttgacttccacgatcttcatactctttctcctttgaggg

Gcagccacaaaaaaaatcgacggattatacctcctttcttcaaggcggcaatattcttttcgttgactttagtcaaaatgataacggtttgagataa

Agttattttatattcagatggttatgaaagaagattattccatccgaaaactaacctttaccctggcacaagtcttctttcgccgcgcgcctgggga

Aaagacgtgcaaaaaggttgtgtaaagcagtctcgcaaacgtttgctttccctgttagaattgcgccgaattttatttttctaccgcaagtaacgcg

Tggggacccaagcagtgaccgataaaacctctcttagctacaaagatgccggtgttgatattgacgcgggtaatgctctggttggaagaatcaaagg

cgtagtgaagaaaacgcg

 

>guaB

Cttctgttgcagcagcccttcaccggccggctgcatactctcaacgattatctggtagtcgccgcgcggctcgtagagcgtaatattggcgcgaact

Aaaacttgttgcccatgctgtgggcggaaggtcacccggcggttgctgttgcggaacatcgcgcagcgtacctgggcggtgtcgtctttgagtgtaa

Agtaccagtgaccggaagctggttgcgtgaaattagaaatttcgccgctgatccaaacctgtcccatctcatgctcaagcagcagacgaaccgtttg

Attcaggcgactaacggtaaaaattgcaggggattgagaaggtaacatgtgagcgagatcaaattctaaatcagcaggttattcagtcgatagtaac

Ccgcccttcggggatagcaagcattttttgcaaaaaggggtagatgcaatcggttacgctctgtataatgccgcggcaatatttattaaccactctg

Gtcgagatattgcccatgctacgtatcgctaaagaagctctgacgtttgacgacgttctcctcgttcctgctcactctaccgttctgccgaatactg

ctgacctcagcacccagc

 

>glnB

Ttgtcagcctgaaaattccggcactggcggagcgcacagaagacattccgctactggcaaatcacctgttgcgccaggcggcagagcgacataaacc

Gtttgtccgcgcgttctctaccgatgcgatgaaacgcctgatgaccgcgagctggccgggtaatgtgcgccagttggtcaacgtgattgaacagtgc

Gtggcgctgacctcatctccggtgattagtgatgcgctggtggagcaggcgctggagggtgaaaatacggcgctgccaacctttgttgaggcacgta

Atcagtttgaactcaactatttgcgtaagctgctgcaaatcaccaaaggcaacgtcacccacgcggcgagaatggcggggcgcaaccggacagaatt

Ttataaactgctttcccgacacgagctggatgcaaacgatttcaaggaatgaattggcgttatgtgttacgtttagcagatcaaaagacaggcgacc

Ttttcaaggaatagcatgaaaaagattgatgcgattataaaacccttcaagctggacgatgtccgcgaagcactggccgaagtcggtattaccggca

tgacggtgaccgaagtga

 

>purL

Ttttacgccgaggtaatcggcaaactgtttcgccagttcgtaatccaggccaaaaggtttcccgttgatttcgttataagtcaggggagtatgaatg

Gtgctcacacgcaactctccccgcgcttgaatggcggcgatacggttgtcggctttaccaaaccagggaatggatggccagagagcgaccgcgagca

Gcagtgccagaatgccgatgaacagataattaatctttaattttttcaattagttaattctctgtgtcgtgcgcgtcccagcttgaaaaaacgtaat

Aatagtgaaaggtttactcataaatgagcggcattttgcgtaaacctgcgccagatggcaacttattacagccattggcggcacgcgttgctaattc

Acgatggtgattttatttccacgcaaacggtttcgtcagcgcatcagattctttataatgacgcccgtttcccccccttgggtacaccgaaagctta

Gaagacgagagacttatgatggaaattctgcgtggttcgcctgcactgtcggcattccgaatcaacaaactgctggcacgttttcaggctgccaggc

tcccggttcacaatattt

 

>purA

Atccgtagcctgcgtgcttatgagaacagcttctctggcaatcaggacgtgatggtcatgagcccggatagcgatttcttccgctacatgaagacgc

Cgacttccgcaacgcgttaatataacgactgcggtacaggtcaataaagccaccgcatcctcagggatgtcggtggttttctttttctataaggata

Atgaatgaattcgacaatctggctggcgcttgccctggttttggtactggaaggtttagggccgatgctttacccgaaggcatggaagaagatgatc

Tctgcgatgaccaatttgcccgataatattttacgtcgttttggcggtggacttgtggttgcgggcgttgtggtctactacatgttgaggaaaacga

Ttggctgaacaaaaaacagactgatcgaggtcatttttgagtgcaaaaagtgctgtaactctgaaaaagcgatggtagaatccatttttaagcaaac

Ggtgattttgaaaaatgggtaacaacgtcgtcgtactgggcacccaatggggtgacgaaggtaaaggtaagatcgtcgatcttctgactgaacgggc

taaatatgttgtacgcta

 

>folD

Cagcgcagacgaaataaatcttaatttcatatatattccttcaatctcatttatcgactccacatccgtatataaccgattactttatttaagacac

Tgatagtagtaaattcctttttatcctctaagaatgtcttaattgaaaatatgcactctattctaaaaaatagagagccccgttagatgaatacttc

Cgcgcaaaatatattcaacacaaatatagacctgaagcggtaaattaccaggctgaaaattctttttatattgtcaggtatttcttaaattatctta

Atccttagacaaggaaataaatcagttccagatttacaacgccatcatggacgaaaaatgaagctttcagtctcagcgacggtgcgcctcaccttcg

Caagaggtcgcttcacgcgataaatctgaaacgaaacctgacagcgcgccccgcttctgacaaaataggcgcatccccttcgatctacgtaacagat

Ggaatcctctctctgatggcagcaaagattattgacggtaaaacgattgcgcagcaggtgcgctctgaagttgctcaaaaagttcaggcgcgtattg

cagccggactgcgggcac

 

>rpiA

Ccgcgcgctcaaatcctcgttcacgtatcaccgcatccagtgcctgtaatgttctgtagtccgggcgtttcattgctgttgtctgctcctggtaaat

Gctttttcctgcactatgacacaattttgtgtcaggttgcatataccgaagccgtcggcgggtaacatttgtatccgtggttaaaagcgcagcttaa

Aagatcagggatttgcgctaatgcatttcgctcagcgagttcgcgccctggttgtgttgaatggcgtggcgttattgcctcaatttgcctgtaaaca

Ggggcttgcgaacggtgaactggtgcgcctgtttgcaccgtggagcggcatacccagaccgttgtatgctttatttgcggggcgaaaggggatgcct

Gccattgcgcgatattttatggatgagttaaccacgcggcttgccaacggggtctgaatcgctttttttgtatataatgcgtgtgaaatttcatacc

Acaggcgaaacgatcatgacgcaggatgaattgaaaaaagcagtaggatgggcggcacttcagtatgttcagcccggcaccattgttggtgtaggta

caggttccaccgccgcac

 

>carA

Gtctttttgatatgcgagatgtacttgatctcaataatttgtaaccacaaaatatttgttatggtgcaaaaataacacatttaatttattgattata

Aagggctttaatttttggcccttttatttttggtgttatgtttttaaattgtctataagtgccaaaaattacatgttttgtcttctgtttttgttgt

Tttaatgtaaattttgaccatttggtccacttttttctgctcgtttttatttcatgcaatcttcttgctgcgcaagcgttttccagaacaggttaga

Tgatctttttgtcgcttaatgcctgtaaaacatgcatgagccacaaaataatataaaaaatcccgccattaagttgacttttagcgcccatatctcc

Agaatgccgccgtttgccagaaattcgtcggtaagcagatttgcattgatttacgtcatcattgtgaattaatatgcaaataaagtgagtgaatatt

Ctctggagggtgttttgattaagtcagcgctattggttctggaagacggaacccagtttcacggtcgggccataggggcaacaggttcggcggttgg

ggaagtcgttttcaatac

 

>pdhR

Tgcgtgtgtaagtttgcaattccgtttgttgtattaatttgtttacatcaaagaagtttgaattgttacaaaaagacttccgtcagatcaagaataa

Tggtatgcggcagcgaatgcacccgctttatgcatggttgaagatgagttgcttaaaaagaaaccgtttgtaaagctcagcctcaacccctctcaat

Atgtagaatgaatttaaattcgttttaattgaattaaaaatcacaaaattggtaagtgaatcggttcaattcggatttttatagtttaataatcgtt

Aaaaaactcctttcctacgtaaagtctacatttgtgcatagttacaactttgaaacgttatatatgtcaagttgttaaaatgtgcacagtttcatga

Tttcaatcaaaacctgtatggacataaggtgaatactttgttactttagcgtcacagacatgaaattggtaagaccaattgacttcggcaagtggct

Taagacaggaactcatggcctacagcaaaatccgccaaccaaaactctccgatgtgattgagcagcaactggagtttttgatcctcgaaggcactct

ccgcccgggcgaaaaact

 

>fixA

Cgattattaacggcggaaagaaaaccttcggttctattcccgtttttctcttttcattcttcatgagttaattccactgtgaaaacgaatatttatt

Ttgcgttcccgtttgttttatttttgttaacatttaatataattattattaacctcgtggacgcgttaatggctaactcataatgggtattcaataa

Gctgtattctgtgattggtatcacatttttgtttcgggtgaatagagggcgttttttcgttaattttgattaataatcagtttgttatgctctgttg

Tgagtaaaaaataacatctgactttcaatattggtgatccataaaacaatattgaaaatttctttttgctacgccgtgttttcaatattggtgagga

Acttaacaatattgaaagttggatttatctgcgtgtgacattttcaatattggtgattaaagttttatttcaaaattaaagggcgtgatatctgtaa

Ttaacaccaccgatatgaacgacgtttccttcatgatttctggagatgcaatgaagattattacttgctataagtgcgtgcctgatgaacaggatat

tgcggtcaataatgctga

 

>rbsD

Attgcatgagcgggtcgattctgttaactctgcgcaccgaagacgctccatatgtccataacgtccgtcgggtacagattgaacaactgtcgcccac

Tttctggcgcgtggtggcaagttatggttgcgagaaacgccaaacgtagaagaagttttccaccgctgcggtctggaaggattaagttgccggatga

Tggaaacctccttctttatgtcgcatgagtcgttgatcctcgcaaacgcccgtggtatttgcgtctgcgcggcaagctgtacttgctgctgcaacgt

Aatgcgctgcgtgcaccagatcaatttgaaatcccgccaaacagggttatcgaactgggtactcaggtcgaaatctaacgccagacgcctcctttct

Tcataagggggcgtttttgttttcatggttaatcaccatgtaaaacgtttcgaggttgatcacatttccgtaacgtcacgatggttttcccaactca

Gtcaggattaaactgtgggtcagcgaaacgtttcgctgatggagaaaaaaatgaaaaaaggcaccgttcttaattctgatatttcatcggtgatctc

ccgtctgggacataccga

 

>araB

Ctgaccgcgaatggtgagattgagaatataacctttcattcccagcggtcggtcgataaaaaaatcgagataaccgttggcctcaatcggcgttaaa

Cccgccaccagatgggcgttaaacgagtatcccggcagcaggggatcattttgcgcttcagccatacttttcatactcccaccattcagagaagaaa

Ccaattgtccatattgcatcagacattgccgtcactgcgtcttttactggctcttctcgctaacccaaccggtaaccccgcttattaaaagcattct

Gtaacaaagcgggaccaaagccatgacaaaaacgcgtaacaaaagtgtctataatcacggcagaaaagtccacattgattatttgcacggcgtcaca

Ctttgctatgccatagcatttttatccataagattagcggatcctacctgacgctttttatcgcaactctctactgtttctccatacccgttttttt

Ggatggagtgaaacgatggcgattgcaattggcctcgattttggcagtgattctgtgcgagctttggcggtggactgcgctaccggtgaagagatcg

ccaccagcgtagagtggt

 

>acnB

Cagacacagccagttgtgtcgattgcggttccacaggcgcttccactgtgcggctttttatatatagcccggtagaggcggcacaaagcccggcact

Gcaaattagcgccagcacatggggtttaaacggcaaagtcattttcataattcggatctcaaggaaatcgcaatggtcggcgaactgccacccgcag

Gtgctgtgaatccgagtataaagaggcggtagtttaaattttgactaatcttgggattcgttgagaaaggtgattatcaccatgcgaattaacgaag

Tttttacggagggaaacaatctctagaccatccttaacgattcagccacttttttatgttgcttttttgtaaacagattaacacctcgtcaaaatcc

Tgctattctgcccgttgcggtactgggcatttaccctacaaactgctgtctcacaggagcgtgaagagaatcgcctgccgcactatgacaatgagag

Cgaggagaaccgtcgtgctagaagaataccgtaagcacgtagctgagcgtgccgctgaggggattgcgcccaaacccctggatgcaaaccaaatggc

cgcacttgtagagctgct

 

Программа AlignACE 3.0 нашла только один сайт, совпадающий с эксперементальным, в последосательности glnB.

 

Программа MEME (One per sequence) нашла 2 сайта, совпадающих с эксперементальным.

 

Программа MEME (Zero or one per sequence) нашла 7 сайтов, совпадающих с

 

 

.


Задание №2. Поиск сайтов в эукариотических последовательностях.

Выравнивание последовательностей A2_Human и A2_Mouse, на котором

размечены все найденные сайты:

 
>sequence1 Human:1-1000 (+)
>sequence2 Mouse:47-991 (+)
 
000000001  GCCTCCTCAGGTACCCCCTGCCC----CCCACAGCTCCTCTCCTGTGCCTTGTTTCCCAG  000000056
>>>>>>>>>  | |||||||||| ||     |||    |||| | | |||||||||| ||||| |||| ||  <<<<<<<<<
000000047  GTCTCCTCAGGTGCCTGGCTCCCAGTCCCCAGAACGCCTCTCCTGTACCTTGCTTCCTAG  000000106
 
000000057  C-----CATGCGTTCTCCTCTATAAATACCCGCTCTGGTATTTGGGGTTGGCAGCTGTTG  000000111
>>>>>>>>>  |     | | | |||||||||||||||||| |||||||||||| |  |||||||||||||  <<<<<<<<<
000000107  CTGGGCCTTTCCTTCTCCTCTATAAATACCAGCTCTGGTATTTCGCCTTGGCAGCTGTTG  000000166
 
000000112  CTGCCAGGGAGATGGTTGGGTTGACATGCGGCTCCTGACAAAACACAAACCCCTGGTGTG  000000171
>>>>>>>>>  |||| ||||||| || ||| |||||||||  ||||||||||||||||||||| |||||||  <<<<<<<<<
000000167  CTGCTAGGGAGACGGCTGGCTTGACATGCATCTCCTGACAAAACACAAACCCGTGGTGTG  000000226
 
000000172  TGTGGGCGTGGGTGGTGTGAGTAGGGGGATGAATCAGGGAGGGGGCGGGGGACCCAGGGG  000000231
>>>>>>>>>   ||||| ||||| |||||||||||||||||||||||| ||||||||| ||||  ||||||  <<<<<<<<<
000000227  AGTGGGTGTGGGCGGTGTGAGTAGGGGGATGAATCAGAGAGGGGGCGAGGGAGACAGGGG  000000286
 
000000232  -GCAGGAGCCACACAAAGTCTGTGCGGGGGTGGGAGCGCACATAGCAATTGGAAACTGAA  000000290
>>>>>>>>>   ||||||| ||  ||||| |  |||||||||| ||   |||   ||| |||||||| |    <<<<<<<<<
000000287  CGCAGGAGTCAGGCAAAGGCGATGCGGGGGTGCGACTACAC---GCAGTTGGAAACAG--  000000341
 
000000291  AGCTTATCAGACCCTTTCTGGAAATCAGCCCACTGTTTATAAACTTGAGGCCCCACCCTC  000000350
>>>>>>>>>     |  |||||    |||||||||  | |   |||  |||||||||||              <<<<<<<<<
000000342  ---TCGTCAGA-AGATTCTGGAAACTATCTTGCTGGCTATAAACTTGA------------  000000385
 
000000351  GACAGTACCGGGGAGGAAGAGGGCCTGCACTAGTCCAGAGGGAAACTGAGGCTCAGGGCT  000000410
>>>>>>>>>            |||| | ||| ||||  || |  |||  |||||||||||||||||| | |  <<<<<<<<<
000000386  ----------GGGAAGCAGAAGGCCAACATTCCTCCCAAGGGAAACTGAGGCTCAGAGTT  000000435
 
000000411  AGCTCGCCCATA-----GACATACATGGCAGGCAGGCTTTGGCCAGGATCCCTCCGCCTG  000000465
>>>>>>>>>  |   | |   ||     || || ||||        ||   ||||||| || |||   |||  <<<<<<<<<
000000436  AAAACCCAGGTATCAGTGATATGCATG-------TGCCCCGGCCAGGGTCACTC--TCTG  000000486
 
000000466  CCAGGCGTCTCCCTGCCCTCCCTTCCTGCCTAGAGACCCCC--------ACCCTCAAG-C  000000516
>>>>>>>>>   |   |   | ||| |||| |   ||| ||||||||| |          |   |  || |  <<<<<<<<<
000000487  ACTAACCGGTACCTACCCTACAGGCCTACCTAGAGACTCTTTTGAAAGGATGGTAGAGAC  000000546
 
000000517  CTGGCTGGTCTTTGCCTGAGACCC----AAACCTCTTCGACTTCAAGAGAATATTTAGGA  000000572
>>>>>>>>>  ||| | || |||||||      |     |||||||  |   ||| ||  ||  | |  ||  <<<<<<<<<
000000547  CTGTCCGGGCTTTGCCCACAGTCGTTGGAAACCTCAGCATTTTCTAGGCAACTTGTGCGA  000000606
 
000000573  ACAAGGTGGTTTAGGG--CCTTTCCTGGGAACAGGCCTTGACCCTTTAAGAAATGACCCA  000000630
>>>>>>>>>  | ||     ||  |||  ||||              ||||  | ||     ||| ||| |  <<<<<<<<<
000000607  ATAAAACACTTCGGGGGTCCTT--------------CTTGTTCATT---CCAATAACCTA  000000649
 
000000631  AAGTCTCTCCTTGACCAAAAAGGGGACCCTCAAACTAAAGGGAAGCCTCTCTTCTGCTGT  000000690
>>>>>>>>>  ||  ||||||| |   ||||  |||  |||||||| ||| | ||  ||||   | ||| |  <<<<<<<<<
000000650  AAACCTCTCCTCGGAGAAAATAGGGGGCCTCAAAC-AAACGAAATTCTCTAGCCCGCTTT  000000708
 
000000691  CTCCCCTGACCCCACTCCCCCCCACCCCAGGACGAGG-AGATAACCA---GGGCTGAAAG  000000746
>>>>>>>>>                          ||||||||  ||| ||  | |||   ||    ||||  <<<<<<<<<
000000709  ------------------------CCCCAGGATAAGGCAGGCATCCAAATGGAAAAAAAG  000000744
 
000000747  AGGCCCGCCTGGGGGCTGCAGACATGCTTGCTGCCTGCCCTGGCGAAGGATTGGCAGGCT  000000806
>>>>>>>>>   |||| ||| |||| || | | ||     ||| | |||||||   ||      ||||||   <<<<<<<<<
000000745  GGGCCGGCCGGGGGTCTCCTGTCA-----GCTCCTTGCCCTGTGAAA--CCCAGCAGGCC  000000797
 
000000807  TGCCCGTCACAGGACCCCCGCTGGCTGACTCAGGGGCGCAGGCCTCTTGCGGGGGAGCTG  000000866
>>>>>>>>>  |||| |||    | || |    ||||| | ||||||||||||||||||||||||||||||  <<<<<<<<<
000000798  TGCCTGTCTTCTGTCCTCTTGGGGCTGTC-CAGGGGCGCAGGCCTCTTGCGGGGGAGCTG  000000856
 
000000867  GCCTCCCCGCCCCCACGGCCACGGGCCGCCCTTTCCTGGCAGGACAGCGGGATCTTGCAG  000000926
>>>>>>>>>  |||||||||||||| || |   || |  || |||||||||||||||| |||||| |||||  <<<<<<<<<
000000857  GCCTCCCCGCCCCCTCGCCTGTGGCCGCCCTTTTCCTGGCAGGACAGAGGGATCCTGCAG  000000916
 
000000927  CTGTCAGGGGAGGGGAGGCGGGGGCTGATGTCAGGAGGGATACAAATAGTGCCGACGGCT  000000986
>>>>>>>>>  ||||||||||||||| | |||||| |||||||||||||| |||||||||||| ||| |||  <<<<<<<<<
000000917  CTGTCAGGGGAGGGGCGCCGGGGGGTGATGTCAGGAGGGCTACAAATAGTGCAGACAGCT  000000976
 
000000987  G-GGGGCCCTGTCTC  0000001000
>>>>>>>>>    ||||| | ||| |  <<<<<<<<<
000000977  AAGGGGCTCCGTCAC  000000991
 
Синим цветом  выделены сайты для транскрипционного фактора AP2.
Фиолетовым цветом  выделен сайт для транскрипционного фактора SRF.
Зеленым цветом выделен сайт для транскрипционного фактора GATA1.

 

 

Результаты расчета, на сколько нуклеотидов приходится один сайт.

 
 

Поделил среднюю длину одной пары последовательностей на суммарное

число всех найденных сайтов (12).

 
((1000+944)/2)/12 = 80,08
 

На какое число нуклеотидов в среднем приходился бы один сайт если бы

мне необходимо было найти сайты для всех 407 факторов, имеющихся в

арсенале программы rVISTA.

 

Чтобы узнать это, разделил полученное значение на 50.

 
80,08/50 = 1,616
 

Выравнивание последовательностей В2_Human и В2_Mouse, на котором

размечены все найденные сайты:

 
>sequence1 Human:1-484 (+)
>sequence2 Mouse:1-531 (+)
 
000000001  CTCTCGCCTTCTGGGGTGG-GGGGTCCCGTC-----------------------------  000000030
>>>>>>>>>  | |  |||||||  ||| | |||||  || |                               <<<<<<<<<
000000001  CGCAGGCCTTCTTTGGTCGAGGGGTGTCGACTTTAGACCACAGAGCTTGCTCAGCATCAC  000000060
 
000000031  ------CTTTCCCCCACTGAGG-------ACAGAGGCCCGCCCAGCGATCTGAGCATGTG  000000077
>>>>>>>>>        ||| |||| |||| |        || |    || || || ||   ||||| ||   <<<<<<<<<
000000061  TGATGCCTTCCCCCAACTGTGTGGCCTGCACCGCCTGCCTCCGAGTGAGTGGAGCACGT-  000000119
 
000000078  TGGACGTCAATCTTGCAGCCCCTCTTCCAGGCCCCCTCCCCAGCCTTGCAGGGCTCAGGT  000000137
>>>>>>>>>       |||| ||||||||||||  | | ||||||||||| ||||| ||||||||||||||  <<<<<<<<<
000000120  -----GTCAGTCTTGCAGCCCCCTTCCTAGGCCCCCTCCTCAGCC-TGCAGGGCTCAGGT  000000173
 
000000138  TACCCCTGGCCTTTCCTAAAGGTCACTCATTCCTCTTGA-CGTTTGCAAAAGGGGAATGT  000000196
>>>>>>>>>  |||||||||||||||  ||||| ||||  |||||||| | | ||||||| || |||||||  <<<<<<<<<
000000174  TACCCCTGGCCTTTCTAAAAGGGCACTGGTTCCTCTTTAACCTTTGCAAGAGTGGAATGT  000000233
 
000000197  AATCCTGGGGTGGGGGGAGACCC-CTCATCTGTAGCCCCTCCCTTGCTCCTCCCAAAGGG  000000255
>>>>>>>>>  ||   |   | ||||  |||||| | |||| | | || ||| |  |||  |||||||| |  <<<<<<<<<
000000234  AAGTTT---GAGGGGAAAGACCCTCCCATCAGAAACCTCTCTCCAGCT-TTCCCAAAGAG  000000289
 
000000256  TGGAATTAGAAC-AGGGACTGTTATTGGGAGACAGAAAGTGG-------GGGATAGTAGT  000000307
>>>>>>>>>  || |  |  ||  || |||| |||||||| ||||||||| |        |||| |||     <<<<<<<<<
000000290  TGAACCTCAAAGTAGAGACTTTTATTGGGGGACAGAAAGAGAATGCATAGGGACAGTCAG  000000349
 
000000308  TGACCTTTGGTAAGGGGGCAG--------GTGCCCAGGGCCAGAGGCTTCTGCTTCAGGC  000000359
>>>>>>>>>  |  | ||||  ||||||| |         | ||||  || |||  |||| |||||| |||  <<<<<<<<<
000000350  TAGCTTTTGAGAAGGGGGTACACGCCCCAGGGCCCCAGGTCAGGAGCTTTTGCTTCGGGC  000000409
 
000000360  TGTAGTGGGCACTTGGCTGCCAGCCCAGTGTGAAGGGG-GGAGGATGGAGAGAAAGAGAG  000000418
>>>>>>>>>  || |||||||||||||||||| |||   |||| ||||| ||||||||||  |  ||||||  <<<<<<<<<
000000410  TGCAGTGGGCACTTGGCTGCCTGCC---TGTGGAGGGGAGGAGGATGGAATG--AGAGAG  000000464
 
000000419  GCGGGGCTGGCTGGGG-ACCGAGTGGCTCAGGGATAAATGCGCAGCCTGAGAGGGGGTGA  000000477
>>>>>>>>>  |||||||||||||||| || | ||||||  | ||||||||| ||| ||||||||||||||  <<<<<<<<<
000000465  GCGGGGCTGGCTGGGGGACAGGGTGGCTTGGAGATAAATGCCCAGTCTGAGAGGGGGTGA  000000524
 
000000478  GCTGACA  000000484
>>>>>>>>>   ||||||  <<<<<<<<<
000000525  ACTGACA  000000531
 
 
Синим цветом выделены сайты для транскрипционного фактора AP2.
Темно-красным толстым выделен сайт для транскрипционного фактора MYOD.
Красным цветом выделен сайт для транскрипционного фактора TEF1.
Зелным толстым выделены сайты для транскрипционного фактора GATA1.
Оранжевым толстым выделен сайт для транскрипционного фактора MEF3.
Желтым толстым выделен сайт для транскрипционного фактора SRF.
 

Результаты расчета, на сколько нуклеотидов в среднем приходится один сайт.

 
 

Поделил среднюю длину одной пары последовательностей на суммарное

число всех найденных сайтов (11).

 

((484+ 531)/2)/11) = 46.13

 

На какое число нуклеотидов в среднем приходился бы один сайт если бы мне

необходимо было найти сайты для всех 407 факторов, имеющихся в арсенале

программы rVISTA.

 

Чтобы узнать это, разделил полученное значение на 50.

46.13/50 = 0.92
                                              

 

 


На главную страницу третьего семестра

На главную


© Кузеванов Алексей,2005