Семестры
Сайт ФББ МГУ
Kodomo Wiki
NCBI

RanHummer personal web-site


Нуклеотидный blast


Задание 2. Сравните списки находок нуклеотидной последовательности 3-я разными алгоритмами blast

Область поиска: Arabidopsis (taxid:3701)

Последовательность.

Число находок

E-value для худших находок

Сходство для худших находок

Примеры уникальных находок

Max score

Total score

Query cover

E value

Ident

Accession

Megablast

17

2e-23

4e-20

6e-8

90%

97%

100%

62.1

62.1

5%

6e-08

100%

XM_002886274.1

Discontiguous megablast

18

4e-27

8e-24

2e-19

77%

77%

95%

152

152

47%

3e-35

73%

CP002688.1

152

152

47%

3e-35

73%

AB026661.1

Blastn

20

3e-23

2e-19

2e-7

83%

95%

100%

Все белки, которые есть выше

113

113

18%

3e-23

83%

X54928.1

Megablast нашел один белок потому, что настроен на хорошие точные совпадения доменов, что вполне может быть ввиду 5% покрытия запроса. Discontiguous megablast облегчил вхождение в результат длинных, но не очень качественных покрытий. Blastn расширил диапазон еще больше и захватил промежуточный результат, самый плохой из всего, что было.

Задание 3. Проверить наличие гомологов пяти белков в геноме одного из организмов

ID

Entry

Name

Function

Amount

Of good hits

Best Hit

Max score

Total score

Query cover

E value

Ident

Accession

HSP7C_HUMAN

P11142

Heat shock cognate 71 kDa protein

Acts as a repressor of transcriptional activation

0


TERT_HUMAN

O14746

Telomerase reverse transcriptase

essential for the replication of chromosome termini in most eukaryotes

2

106

190

43%

3e-22

28%

NC_003076.8

CISY_HUMAN

O75390

Citrate synthase, mitochondrial

Acetyl-CoA + H2O + oxaloacetate = citrate + CoA

9

110

459

76%

3e-32

46%

NC_003074.8

RPB1_HUMAN

P24928

DNA-directed RNA polymerase II subunit RPB1

catalyzes the transcription of DNA into RNA using the four ribonucleoside triphosphates as substrates

13

899

1780

79%

0.0

54%

NC_003075.7

PABP2_HUMAN

Q86U42

Polyadenylate-binding protein 2

Involved in the 3'-end formation of mRNA precursors (pre-mRNA) by the addition of a poly(A) tail of 200-250 nt to the upstream cleavage product

3

89.7

341

26%

7e-19

64%

NC_003076.8

Итого: наибольшее совпадение было у распространенных белков, таких как ДНК-зависимая РНК-полимераза. Белок же теплового шока человека ожидаемым образом в растении не встретился. Белок цикла лимонной кислоты весьма распространен, и ожидаемо показал встречаемость в геноме.

Задание 4. Классифицировать геномы родственных вирусов по сходству последовательностей

Таблица сравнения выравниваний геномов вирусов. Использовались вирусы семейства Tobamovirus.

По результатам сравнения можно сказать, что наиболее похожи друг на друга три вируса:

ID

NC_001367.1

NC_022230.1

NC_028478.1

Name

Tobacco mosaic virus

Tomato mottle mosaic virus isolate MX5

Tomato brown rugose fruit virus isolate Tom1-Jo

Они имеют совместные выравнивания длиннее полутора тысяч нуклеотидов и сходство более 90% при этом, занимая первые три строчки качественных выравниваний. Все они имеют сходного хозяина и признаки, поэтому это было предсказуемо.


© Поляков Игорь aka RanHummer