Работа с программой BLAST

 Поиск белка по его последовательности

  Был проведён поиск белка GLK_ECOLI по его аминокислотной последовательноти в банке swissprot. Доступ к программе BLASTP, которой выполнялся поиск, осуществлялся через сервер NCBI.   

 Полученные результаты:

Порядковый номер при выдаче: 1.
Score: 619 bits (1596).
E-value: 4e-177.


  Затем был проведён поиск той же аминокислотной последовательноти, но в банке pdb. Первым в списке оказался код 1Q18

 Полученные результаты:

В файле 1Q18.PDB содержится информация о цепи B белка глюкокиназа, не связанного с молекулой глюкозы.
Score: 605 bits (1561).
E-value: 3e-174.
Начало и конец выравнивания во входной последовательности: 2 - 321.
Начало и конец выравнивания в находке: 13 - 332.



 Поиск белка по его гомологу

  Был проведён поиск белка GLK_ECOLI в банке swissprot по аминокислотной последовательности его гомолога GLK_SALTY.

 Полученные результаты:

Порядковый номер искомого белка: 3.
Score: 619 bits (1597).
E-value: 3e-177.
Начало и конец выравнивания во входной последовательности: 1 - 321.
Начало и конец выравнивания в находке: 1 - 321.
Identities: 301/321 (93%).

  Первая по счёту находка является тем самым белком, чья последовательность была подана на вход.


 Поиск белка по фрагментам его последовательности

  БЫл осуществлён поиск белка GLK_ECOLI программой BLASTP в банке swissprot по части его аминокислотной последовательности, взятой из файла thirdprot.fasta. Выравнивание было сделано неточно. Т. к. задаваемая аминокислотная последовательность состоит из двух частей, то программа BLASTP сделала два выравнивания для искомого белка.

 Полученные результаты:

 1) Для первой части последовательности:

Порядковый номер искомого белка: 2.
Score: 28.1 bits (61).
E-value: 6.1.
Начало и конец выравнивания во входной последовательности: 1 - 21.
Начало и конец выравнивания в находке: 103 - 121.
Identities: 16/21 (76%).

 2) Для второй части оследовательности:

Порядковый номер искомого белка: 2.
Score: 28.1 bits (61).
E-value: 6.1.
Начало и конец выравнивания во входной последовательности: 13 - 24.
Начало и конец выравнивания в находке: 249 - 260.
Identities: 12/12 (100%).

 Разные пользовательские интерфейсы BLAST

  Был выполнен поиск белка GLK_ECOLI по его аминокислотной последовательноти в банке swissprot.

  В отличие от EMBI и Пастеровского института, EMBL-EBI не отображает графической схемы веса найденных последовательностей.
  Очень похожие друг на друга аминокислотные последовательности EMBL-EBI отображает отдельно.
  Сервер EMBL-EBI позволяет быстро находить дополнительные сведения о найденных объектах.
  Ресурс Пастеровского института неудобен для пользователя, т. к. требуется записывать адрес электронной почты и т. к. сервер очень часто перегружен и предлагается подождать и сделать запрос позже. ТАкже на этом сервере нельзя менять матрицу замен и штрафы за открытие и продолжение гэпов.
  Сервер NCBI позволяет выбирать организм или группу, к которой относится данный организм, информацию об изучаемых веществах которого ищут.
  Веса аминокислотных последовательностей и значения E-value различны на разных ресурсах, но не на много.

  Каждый из серверов создавался для более-менее удобной работы, но, наверное, можно сказать, что из этих трёх ресурсов наиболее удачными являются NCBI и EMBL-EBI.

 Является ли BLAST инструментом для поиска ортологов?

  С помощью программы BLASTP был проведён поиск по банку данных Swiss-Prot для репрессора рибозного оперона RbsR из Bacillus subtilis. Среди первых 20 находок 6 содержат в своём названии "RbsR". Они представляют собой репрессоры оперона рибозы, и в первом приближении можно считать, что эти белки являются ортологами.

  Все 20 белков, выполняют, в широком смысле, очень похожии функции. Программа BLASTP позволяет искать гомологи, но она не позволяет различать ортологи и паралоги. Для того, чтобы выделить ортологи из полученного списка необходимы дополнительные сведения о этих белках.

 Результат поиска, информация о первых 20 белках:

                                                                   Score     E
							  	   (Bits)  Value

gi|2851638|sp|P36944|RBSR_BACSU  Ribose operon repressor >gi|2...   610    2e-174
gi|20139764|sp|Q9K6K2|RBSR_BACHD  Ribose operon repressor           254    3e-67 
gi|20139702|sp|Q9CF41|RBSR_LACLA  Ribose operon repressor           241    2e-63 
gi|1173387|sp|P43472|SCRR_PEDPE  Sucrose operon repressor (Scr op   151    3e-36 
gi|115950|sp|P25144|CCPA_BACSU  Catabolite control protein A (...   148    3e-35 
gi|3024530|sp|Q45831|REGA_CLOSA  HTH-type transcriptional regulat   147    6e-35 
gi|37999777|sp|Q9CPA2|RBSR_PASMU  Ribose operon repressor           142    1e-33 
gi|3023459|sp|Q56194|CCPA_STAXY  Probable catabolite control prot   135    2e-31 
gi|26007033|sp|Q54430|SCRR_STRMU  Sucrose operon repressor (Scr o   135    2e-31 
gi|18202290|sp|P58258|REGA_CLOAB  HTH-type transcriptional regula   133    7e-31 
gi|1168844|sp|P46828|CCPA_BACME  Glucose-resistance amylase re...   132    1e-30 
gi|585043|sp|P37947|DEGA_BACSU  HTH-type transcriptional regulato   131    2e-30 
gi|82581649|sp|P0ACP0|CYTR_SHIFL  HTH-type transcriptional rep...   130    4e-30 
gi|38604814|sp|Q8CNV8|CCPA_STAES  Probable catabolite control ...   130    4e-30 
gi|1172870|sp|P44329|RBSR_HAEIN  Ribose operon repressor            130    6e-30 
gi|82582997|sp|P0ACQ3|RBSR_SHIFL  Ribose operon repressor >gi|...   127    5e-29 
gi|82582278|sp|P0ACP9|PURR_SHIFL  HTH-type transcriptional rep...   125    1e-28 
gi|7388031|sp|O68446|PURR_SALTY  HTH-type transcriptional repr...   125    2e-28 
gi|119334|sp|P27871|ENDR_PAEPO  Probable HTH-type transcriptional   125    2e-28 
gi|38604906|sp|Q8NW33|CCPA_STAAW  Probable catabolite control ...   124    4e-28.


На главную страницу второго семестра


©Дмитрий