Занятие 3.Поисковые системы.



Задание 1.

А. В Mrs предствлены сведения только из записи о белке. Оформление тяготеет к строгому классическому виду, что повышает читабельность, однако цвета оформления: оранжевый, красный - достаточно яркие, порой отвлекает. Ссылки толко на статьи в PubMed, нет никаких изображений. Очень интересно сделана графа Features (с возможностью прокрутки), Это позволяет сократить длину страницы, к тому же так удобнее искать какую-то определенную особенность строения. Нажимая на определенную строку, ниже в последовательности выделяешь аминокислотный участок, о котором идет речь. Аминокислотная последовательность представлена только в одном формате(если я не ошибаюсь - PIR). В целом, если нужны общие стандартные сведения, то пользоваться этой поисковой системой удобно.

B. Первое, что сразу понравилось - это наличие ссылок на разные самые важные части описания- если человек ищет что-то определенное, то это очень облегчает и ускоряет работу. Оформление не хуже, чем у MRS: также легко разобрать, где и что написано, четко разделены графы. Большой плюс в том, что можно сразу скачать статьи об этом белке, что также несомненно ускоряет работу. Графа Features - более удачна в том плане, что можно посмотреть наглядно, где какая стрктура расположена. Однако графическое представление не дает точных координат участков, особенностей, поэтому ниже приведена отдельная табличка с координатами: чтобы посмотреть аминокислотную последовательность участка приходится переходить по ссылке, что не очень наглядно и удобно. Плюс в том, что есть разнообразие форматов представления ак последовательности.

C. Представлено больше информации. Самая читабельная разметка страницы. Самое наглядное представление FT. Один вариант написания ак последовательноси. Также наличие ссылок на самые важные графы в документе. Эта поисковая система показалась мне наиболее удобной для работы.

Задание 2.

1. bacillaceae, bacillales, bacillariaceae, bacillariales, bacillariophyceae, bacillariophycidae,bacillariophyta, bacillus

2. 15225

3. 67312

Задание 3.

Формулировка функции белкаСтрока запросаКоличество найденных документов
Endoribonuclease EndoA (([swissprot-Description:Endoribonuclease*] & [swissprot-Description:EndoA*]) & [swissprot-Taxonomy:Firmicutes*]) 1
mRNA interferase EndoA ((([swissprot-Description:mRNA*] & [swissprot-Description:interferase*]) & [swissprot-Description:EndoA*]) & [swissprot-Taxonomy:Firmicutes*]) 1
Toxin EndoA (([swissprot-Description:Toxin*] & [swissprot-Description:EndoA*]) & [swissprot-Taxonomy:Firmicutes*]) 1

Задание 4.

Последовательность

Задание 6.

1. сd /P/y10/Term_2/Block1/Practice3/
grep '^ID' -c bacsu.gbk
Итого 18202 записей с белками Bacillus subtilis

2. сd /P/y10/Term_2/Block1/Practice3/
grep '^RN' bacsu.gbk | grep 1[0-5] -c
Итого 42 строки. Из них:
20 строк с номером ссылки 10 ( grep '^RN' bacsu.gbk | grep 1[0-5] | grep 10 -c )
10 строк с номером ссылки 11 (grep '^RN' bacsu.gbk | grep 1[0-5] | grep 11 -c)
6 строк с номером ссылки 12 (grep '^RN' bacsu.gbk | grep 1[0-5] | grep 12 -c)
4 строки с номером ссылки 13 (grep '^RN' bacsu.gbk | grep 1[0-5] | grep 13 -c)
2 строки с номером ссылки 14 (grep '^RN' bacsu.gbk | grep 1[0-5] | grep 14 -c)
0 строк с номером ссылки 15 (grep '^RN' bacsu.gbk | grep 1[0-5] | grep 15 -c)
Таким образом 20 записей белков имеют от 10 до 15 ссылок


© SHADRINA О. А. 2010