Поисковые системы


1)Сравнение поисковых систем

Сравнение MRS и SRS

В обоих поисковых системах приведена подробная информация из записи в SwissProt, но в SRS, в отличие от MRS, больше
ссылок на смежные темы, что облегчает работу по поиску информации о данном белке из других источников.
Так в SRS встречаются гиперссылки на UniRef, где содержится укороченная информация о белке,
есть возможность скачать в различных форматах основные статьи, в которых описывается данный белок(в разделе References),
также в графе перекрестных ссылок(Database сross-references) есть гиперссылки, которые отсутствуют в MRS. Перечисленные
свойства позволяют быстро получять доступ к различным источникам информации.
Также SRS отличается удобством и наглядностью в графе Особенностей белка(Features). Так в SRS графически представлено
расположение различных структур белка(бета-листов, поворотов, спиралей, важных функциональных доменов и лигандов) в
виде диаграммы. Такая наглядность дает возможность проследить закономерности в расположении элементов вторичной структуры.
Полезной особенностью SRS в отличие от MRS является то, что последовательность белка в SRS может быть представленна в различных
форматах(FASTA, Swiss-Prot и т.д.). Это дает возможность работать с этой последовательностью в различных программах.

Сравнение с результатами непосредственного поиска в UniProt

В UniProt также наглядно представлена вторичная структура(в виде диаграммы), но неудобно работать с отдельными участками цепи(если в SRS мы могли сразу найти
в списке нужный структурный участок цепи, то в UniProt нужно искать его на диаграмме, на которой, кстати, не отражены ни лиганды, ни функциональные домены).
Также из недостатков UniProt можно назвать неупорядоченное расположение блоков описания белка. При нажатии на какое-либо из ключевых слов UniProt
выдает все записи, в которых упоминаются эти слова(SRS выдает только значение этого слова). Это может быть удобно при поиске белков с похожими свойствами.

2)Запросы в SRS

a) У 11 таксонов название начинается на "bacil"

б) Bacillus- 39259 записей в БД

в) Firmicutes- 67277 записей в БД

3)Поиск родственных белков

В "Firmicutes" ищем "asparaginyl & hydroxylase", как единственное упоминание функций моего белка(В Description не упоминаются функции моего белка)
Результат- 1 белок(мой), т.к. мой белок выделен из Bacillus subtilis, которая входит в состав Firmicutes.
Из-за недостатка информации о функциях белка я получил только свой белок. На второй запрос "hydroxylasе" у "Firmicutes" я получил результаты,
которые представил в файле table.html


4)Последовательности схожих белков в FASTA формате


1)
>sp|O85057|LIHY_GEOSE Limonene hydroxylase;
MGSKYAAGHYSCSSYFQSLDIPENRQFVQGMKKRYGQDTVISSVMANTYSGIQMILEAIV
HLRSTDRKKILNYLYNKTFPSPSGNITIESNHHLSREVRIGQANLDGQFDIVWSSEQPIP
AKPLMTNTIIDSANEEQIWKYVVESMGEETADGVLVLDQDQTILYANSAAYSFLRVKQGD
ILKEEQLREISHQLIKKETSKYGVQLFIFKRAKRGPLLVTKPDKEPYRFGRVVTYNPSFE
KELRTASIASQSDANVLILGETGSGKEVLARTIHEQSPRRNGPFVALNAGAIPRELIASE
LFGYVEGAFTGARKGGRPGKFEVADGGTLFLDEIGDMPLELQVNLLRVLEERKVIRIGDH
KERPINVRVIAATNRNLKEEIAYRGSFRSDLYYRLNVFTIHIPPLRDRKEDIETLSLQFL
KNFHQHYCGKGTCHLSNSALQLLQSYNWPGNIRELRNVIERAFLLAIDEPEILPIHLPEE
IQNANCAIPPSSVNNLKDVEKKMIEQALKESKSLTEAAKKLGITRSTLYRKIKQWKIHKT
TFS

2)
>sp|Q0QLF4|NDFS_EUBBA Nicotinate dehydrogenase FAD-subunit;
MKDFEFFAPKTLEEAKGLLHQYKDVPPAIIAGGTDLVIEINDRWEKPDVVIDIKKLKELE
YIRVEENTIHIGALSTFTQIENHPFIRSHVRALYKAASQVGSPQIRNLGTIGGNLSTSSV
AGDGVSAMTTLDATVVLESVRGTRQMKLTDFFDGEGFKRRNALEADEIMTEVIIDRPDAH
SASAFYKLAKRKSLAISVIGGGMAVKVDDAGVCTWASMRGGCIGRYPLHFKQAEEMLVGA
PLTMETMEATLPILHDTVYDMARARPSVLYKKESVQGVFKKLFVDILDQLEGGCNE

3)
>sp|Q0QLF2|NDLMS_EUBBA Nicotinate dehydrogenase large molybdopterin subunit;
MGKDYQVLGKNKVKVDSLEKVMGTAKFAADYSFPDMLYAGVFRSTVPHARIVSLDLSKAR
AIDGVEAVLDYHAIPGKNRFGIIIKDEPCLVDDKVRRYGDAIAVVAAQTPDLVQEALDAI
TIEYEELEGIFTMERALEEDSPAIHGDTNIHQVKHLEYGDVDAAFKQCDIVVEDTYSTHR
LTHMFIEPDAGVSYYDNEGMLTVVVSTQNPHYDRGEVAGMLALPNSKVRIIQATTGGGFG
GKLDLSVQCHCALLTYHTKKPVKMVRSREESTTVSSKRHPMTMHCKTGATKDGRLQAVQV
EMFGDTGAYASYGPAVITRATVHCMGPYVVPNVRVDAKFVYTNNPMSGAFRGFGVPQASV
CHEGQMNALAKALGMDPIDIRILNAHQVGAKLATGQVLENSVGLIETLEKAREKAVEVMG
YEKTR

4)
>sp|Q0QLF1|NDMMS_EUBBA Nicotinate dehydrogenase medium molybdopterin subunit;
MKKRGKGVGSMWYGIGNTGLPNPAAAFVEIHGDGSANVMFGAADIGQGSGTAMAQIAAEE
LGLDYEKIHVTWGDTMVTPDGGATSASRQTLITGNAVILACRQAKETLAKTAAEKLDCAP
EELSFRDNTVFITADPERSMTYGELMAAMKAAGRMAVGAGSYNPNTTGLAPENMSGIPFE
VYSYATTIAEVEVDTETGEVDVLKVVSAHDVGTPINRSMVEGQIEGGVTMGQGFVLMEEI
EVNTKNGAIKNPSMSKYIIPSNRDVPEIHSILVESEGGPGPFGAKGVGEPALIPMIPAVV
AAIEDALGTRFTHTPIMPKDIVAAVKAQEK

5)
>sp|Q0QLF3|NDSFS_EUBBA Nicotinate dehydrogenase small FeS subunit;
MNKITINLNLNGEARSIVTEPNKRLLDLLREDFGLTSVKEGCSEGECGACTVIFNGDPVT
TCCMLAGQADESTIITLEGVAEDGKPSLLQQCFLEAGAVQCGYCTPGMILTAKALLDKNP
DPTDEEITVAMSGNLCRCTGYIKIHAAVRYAVERCAN

5*)Статьи об А.А.Нефахе

Я оставил в таблице только те записи, в которых статья А.А.Нейфаха была первой, всего белков описаных Нейфахом было 12.
Мне кажется, что А.А.Нейфах изучал влияние препаратов на организмы и проявление резистентности у них к этим препаратам.
Мои результаты лежат в файле Term2/Practices/Block1/Practice3/Nejfach.xlsx

6)Поиск с помощью команды grep

В БД 18202 записи.
Отдельные записи я определял по наличию тега "ID" в записи.

Использованные команды:
1)cd /P/y10/Term_2/Block1/Practice3/
2)grep 'ID   [^ ]' bacsu.gbk|wc -l
Поиск "ID" c отступом ровно в 3 пробела после ID

или

1)cd /P/y10/Term_2/Block1/Practice3/
2)grep '^ID' bacsu.gbk|wc -l

6**)Поиск с помощью команды grep

Всего получилось 20 записей

Команды:
1)cd /P/y10/Term_2/Block1/Practice3/
2)grep 'RN   .1[0-5].' bacsu.gbk|grep 10|wc -l

или

1)cd /P/y10/Term_2/Block1/Practice3/
2)grep '^RN' bacsu.gbk|grep 1[0-5]|grep 10|wc -l


Главная страница (см. ниже)


©Abdullaev Eldar