RanHummer personal web-site
Нуклеотидный blast
Задание 2. Сравните списки находок нуклеотидной последовательности 3-я разными алгоритмами blast
Область поиска: Arabidopsis (taxid:3701)
Последовательность.
|
Число находок
|
E-value для худших находок
|
Сходство для худших находок
|
Примеры уникальных находок
|
Max score
|
Total score
|
Query cover
|
E value
|
Ident
|
Accession
|
Megablast
|
17
|
2e-23
4e-20
6e-8
|
90%
97%
100%
|
62.1
|
62.1
|
5%
|
6e-08
|
100%
|
XM_002886274.1
|
Discontiguous megablast
|
18
|
4e-27
8e-24
2e-19
|
77%
77%
95%
|
152
|
152
|
47%
|
3e-35
|
73%
|
CP002688.1
|
152
|
152
|
47%
|
3e-35
|
73%
|
AB026661.1
|
Blastn
|
20
|
3e-23
2e-19
2e-7
|
83%
95%
100%
|
Все белки, которые есть выше
|
113
|
113
|
18%
|
3e-23
|
83%
|
X54928.1
|
Megablast нашел один белок потому, что настроен на хорошие точные совпадения доменов, что вполне может быть ввиду 5% покрытия запроса. Discontiguous
megablast облегчил вхождение в результат длинных, но не очень качественных покрытий. Blastn расширил диапазон еще больше и захватил промежуточный
результат, самый плохой из всего, что было.
Задание 3.
Проверить наличие гомологов пяти белков в геноме одного из организмов
ID
|
Entry
|
Name
|
Function
|
Amount
Of good hits
|
Best Hit
|
Max score
|
Total score
|
Query cover
|
E value
|
Ident
|
Accession
|
HSP7C_HUMAN
|
P11142
|
Heat shock cognate 71 kDa protein
|
Acts as a repressor of transcriptional activation
|
0
|
|
TERT_HUMAN
|
O14746
|
Telomerase reverse transcriptase
|
essential for the replication of chromosome termini in most eukaryotes
|
2
|
106
|
190
|
43%
|
3e-22
|
28%
|
NC_003076.8
|
CISY_HUMAN
|
O75390
|
Citrate synthase, mitochondrial
|
Acetyl-CoA + H2O + oxaloacetate = citrate + CoA
|
9
|
110
|
459
|
76%
|
3e-32
|
46%
|
NC_003074.8
|
RPB1_HUMAN
|
P24928
|
DNA-directed RNA polymerase II subunit RPB1
|
catalyzes the transcription of DNA into RNA using the four ribonucleoside triphosphates as substrates
|
13
|
899
|
1780
|
79%
|
0.0
|
54%
|
NC_003075.7
|
PABP2_HUMAN
|
Q86U42
|
Polyadenylate-binding protein 2
|
Involved in the 3'-end formation of mRNA precursors (pre-mRNA) by the addition of a poly(A) tail of 200-250 nt to the upstream cleavage
product
|
3
|
89.7
|
341
|
26%
|
7e-19
|
64%
|
NC_003076.8
|
Итого: наибольшее совпадение было у распространенных белков, таких как ДНК-зависимая РНК-полимераза. Белок же теплового шока человека ожидаемым образом в
растении не встретился. Белок цикла лимонной кислоты весьма распространен, и ожидаемо показал встречаемость в геноме.
Задание 4.
Классифицировать геномы родственных вирусов по сходству последовательностей
Таблица сравнения выравниваний геномов вирусов. Использовались вирусы семейства Tobamovirus.
По результатам сравнения можно сказать, что наиболее похожи друг на друга три вируса:
ID
|
NC_001367.1
|
NC_022230.1
|
NC_028478.1
|
Name
|
Tobacco mosaic virus
|
Tomato mottle mosaic virus isolate MX5
|
Tomato brown rugose fruit virus isolate Tom1-Jo
|
Они имеют совместные выравнивания длиннее полутора тысяч нуклеотидов и сходство более 90% при этом, занимая первые три строчки качественных выравниваний.
Все они имеют сходного хозяина и признаки, поэтому это было предсказуемо.
|