назад

1) Работа в командной строке Linux:

2) Построить и сравнить оптимальные глобальное и оптимальное локальное выравнивание 2-х последовательностей.

а) Построить полное (глобальное) оптимальное выравнивание с помощью программы needle пакета EMBOSS:

Глобальное выравнивание строится по всей длине сравниваемых последовательностей, существует единственное оптимальное глобальное выравнивание.

Пользуясь программой seqret, создаем файл с последовательностью аминокислот в фаста-формате белка Q21SJ0(PURT_RHOFD) - родственного белку P33221(PURT_ECOLI) (на основании записи в базе данных UniProt): оба белка выполняют идентичную функцию - ферменты трансформилазы, участвующие в биосинтезе пуринов, имеют АТФ-связывающий домен, связывают магний. Но белки принадлежат разным организмам PURT_RHOFD из Rhodoferax ferrireducens, а PURT_ECOLI из Escherichia coli, для белка E. Coli есть 3D-модель, для белка Rhodoferax ferrireducens - нет.

Для выравнивания используем программу needle, название файла с результатом aln_needle.needle, файл содержит: название рабочей программы, дату и время выполнения сравнения, название входящих файлов, название выходящего файла (с результатами), название матрицы, используемой для штрафов и определения веса (BLOSUM62), показаны штрафы за гэп (10,0) и за гэп длины больше, чем 1 (0,5), длина выравнивания: 412, процент идентичности последовательностей: 57,5%, процент сходства последовательностей: 65,8%, число гэпов: 24(5,8%), вес выравнивания: 1042,0, файл содержит также само выравнивание: | обозначаются идентичные аминокислоты, . означат неблизкородственные замены аминокислот (цена такой замены не положительна), : означает - близкородственную замену аминокислот.

Задание штрафов за гэпы, отличных от заданных по умолчанию:

Выходной файл - aln1_needle.needle. Штрафы увеличены в 2 раза: стало за гэп - 20,0, а за гэп длины больше, чем 1 - 1,0. Выравнивание изменилось: оптимальное выравнивание теперь имеет длину: 409, процент идентичности последовательностей: 56,5%, процент сходства последовательностей: 65,0%, число гэпов: 18(4,4%), вес выравнивания: 964.

Получение выдачи в формате, пригодном для импорта в GeneDoc: Выходной файл - aln_needle.msf. Программ needle запущена с опцией -auto (для задания штрафов автоматически), с опцией -aformat msf.

                                                                          
                      *        20         *        40         *          
PURT_ECOLI : MTLLGTALRPAATRVMLLGSGELGKEVAIECQRLGVEVIAVDRYADAPAMHVAH :  54
PURT_RHOFD : MTTLGTPLSHHATKVMLLGSGELGKEVIIALQRLGVETIAVDRYNHAPGQQVAH :  54
             MT LGT L   AT4VMLLGSGELGKEV I  QRLGVE IAVDRY  AP   VAH      
                                                                         
                 60         *        80         *       100              
PURT_ECOLI : RSHVINMLDGDALRRVVELEKPHYIVPEIEAIATDMLIQLEEEG-LNVVPCARA : 107
PURT_RHOFD : HTRTITMSDPALLKALIQAEKPDLVVPEIEAIATPMLEVLEATGVVRVIPTARA : 108
              3  I M D   L4 662 EKP  6VPEIEAIAT ML  LE  G 6 V6P ARA      
                                                                         
              *       120         *       140         *       160        
PURT_ECOLI : TKLTMNREGIRRLAAEELQLPTSTYRFADS-ESLFREAVADIGYPCIVKPVMSS : 160
PURT_RHOFD : ARLTMDREGIRRLAAETLGLPTSPYQFCDSFEELQAAIEGGIGYPCIVKPVMSS : 162
              4LTM1REGIRRLAAE L LPTS Y F DS E L       IGYPCIVKPVMSS      
                                                                         
                    *       180         *       200         *            
PURT_ECOLI : SGKGQTFIRSAEQLAQAWKYAQQGGRAGAGRVIVEGVVKFDFEITLLTVSA--V : 212
PURT_RHOFD : SGKGQSKISGPADVQKAWDYAMAGGRVSHGRVIVEGFIDFDYEITLLTVRAKGA : 216
             SGKGQ3 I     6  AW YA  GGR   GRVIVEG 6 FD5EITLLTV A         
                                                                         
              220         *       240         *       260         *      
PURT_ECOLI : DG---VHFCAPVGHRQEDGDYRESWQPQQMSPLALERAQEIARKVVLALG---- : 259
PURT_RHOFD : DGQIETHFCEPVGHLQVNGDYVESWQPHPMHPAALERARHIAKTVTDDLGIAVD : 270
             DG    HFC PVGH Q 1GDY ESWQP  M P ALERA  IA4 V   LG          
                                                                         
                    280         *       300         *       320          
PURT_ECOLI : ----GYGLFGVELFVCGDEVIFSEVSPRPHDTGMVTLISQDLSEFALHVRAFLG : 309
PURT_RHOFD : GQASGLGIFGVELFVKGEQVWFSEVSPRPHDTGLVTLTTQWQSEFELHARAILG : 324
                 G G6FGVELFV G 2V FSEVSPRPHDTG6VTL 3Q  SEF LH RA LG      
                                                                         
                  *       340         *       360         *       3      
PURT_ECOLI : LPVG-GIRQYGPAASAVILPQLTSQNVTFDNVQNAV---GADLQIRLFGKPEID : 359
PURT_RHOFD : LPVNTALR--NPGASAVIYGGVDAKGIVFDGVDEALRVPGTDL--RLFGKPESF : 374
             LPV   6R   P ASAVI   6    6 FD V  A6   G DL  RLFGKPE        
                                                     
             80         *       400         *        
PURT_ECOLI : GSRRLGVALATAESVVDAIERAKHAAGQVKVQG~ : 392
PURT_RHOFD : VKRRMGVALAAHADVEQARVNAKLAASKVKPRAA : 408
               RR6GVALA    V  A   AK AA  VK          

         

Файл с двойными штрафами в msf-формате: aln1_needle.msf.

б) Построить локальное (частичное) оптимальное выравнивание тех же последовательностей с помощью программы water пакета EMBOSS:

Локальных оптимальных выравниваний уже может быть несколько, поскольку происходит сравнение не по всей длине последовательностей, а поиск похожих фрагментов, без усреднений на весь белок.

Выравнивания со стандартными штрафами (за гэп - 10,0, а гэп, длина которого больше 1 - 0,5): aln_water.water, в msf-формате: aln_water.msf.

Выравнивания с двойными штрафами: aln_big_water.water, aln_big_water.msf.

Выравнивания с штрафами в 2 раза меньше, чем стандартными: aln_small_water.water, aln_small_water.msf.

Сравнение полученных результатов:

Во время глобального выравнивания, находится наиболее оптимальное выравнивание последовательностей по всей их длине. Однако сравниваемые белки могут содержать домены со сходными функциями, но с разным расположением относительно друг друга, локальное выравнивание позволяет учесть это, ведь выравнивая последовательности глобально, можно разделить сходные домены белков, чтобы уменьшить число гэпов.