Программы парного выравнивания



1

Во время выполнения первого задания еще казалось, что предложенное раньше выравнивание данных последовательностей - наилучшее, и посчитан его вес:


-   -   I   G   P   Y   S   Q   G   I   -   -   I  
A   N   I   G   P   Y   S   Q   S   I   S   Q   I  
-12 -2  4   6   7   7   4   5   0   4   -12 -2  4

V   N   N   M   F   Y   S   S   G   Q   I   P   L   T 
V   N   -   -   -   -   I   S   G   Q   I   G   L   I
4   6   -12 -2  -2  -2  -2  4   6   5   4   -2  4   -1 

Суммарный вес этого выравнивания - 23.

2

Но потом меня ждало разочарование:


stretcher seq1.fasta seq2.fasta stretcher.info -auto

########################################
# Program: stretcher                    
# Rundate: Thu 22 Mar 2012 19:15:49     
# Commandline: stretcher                
#    [-asequence] seq1.fasta            
#    [-bsequence] seq2.fasta            
#    [-outfile] alignment.stretcher     
#    -auto                              
# Align_format: markx0                  
# Report_file: alignment.stretcher      
########################################
                                        
#=======================================
#                                       
# Aligned_sequences: 2                  
# 1: 1                                  
# 2: 2                                  
# Matrix: EBLOSUM62                     
# Gap_penalty: 12                       
# Extend_penalty: 2                     
#                                       
# Length: 25                            
# Identity:      12/25 (48.0%)          
# Similarity:    14/25 (56.0%)          
# Gaps:           4/25 (16.0%)          
# Score: 26                             
#                                       
#                                       
#=======================================
                                        
                 10        20           
     1 --IGPYSQGIIVNNMFYSSGQIPLT        
         :::::: :  . .   :::: :         
     2 ANIGPYSQSI--SQIVNISGQIGLI        
               10          20           
                                        
                                        
#---------------------------------------
#---------------------------------------

stretcher.info
Как видно, существует лучшее выравнивание с весом 26. Это обидно, но тоже хорошо)

3

Создадим полное и частичное выравнивания последовательностей моего белка и родственного ему (результаты - по ссылкам):


needle 1QD9.fasta MUG71_SCHPO.fasta needle.info -auto 

needle.info


water 1QD9.fasta MUG71_SCHPO.fasta water.info -auto 

water.info

  1. В частичное выравнивание вошли участки последовательности первой: 49-105, второй - 326-383.
  2. В полном выравнивании (тавтология) выравниваются в этой области участки 50-125 (1) и 327-403 (2), в пересекающемся участке выравнивания полностью совпадают.
  3. Вес полного выравнивания - 96,5; частичного - 112,0. Вес полного выравнивания меньше веса частичного, так как при частичном сравниваются только лишь похожие участки, то есть все гэпы и несоответствия из непохожих просто не учитываются. В полном выравнивании же они тоже влияют на общий вес. Если бы две последовательности были полностью идентичны, то их частичное выравнивание было бы равно полному, и веса их были бы равны.

Дополнительные задания:


1. с помощью команды dotmatcher построили карту локального сходства:


dotmatcher 1QD9.fasta MUG71_SCHPO.fasta
Draw a threshold dotplot of two sequences
Graph type [x11]: ps
Created dotmatcher.ps

dotmatcher.ps и аналог в формате png dotmatcher.png.

2. Попробуем выполнить команду matcher при исходных параметрах и при количестве выводимых выравниваний = 3 (менять вес открытия и продолжения гэпов не очень интересно):


matcher 1QD9.fasta MUG71_SCHPO.fasta matcher.info
matcher 1QD9.fasta MUG71_SCHPO.fasta matcher3.info -alternatives 3

matcher.info
matcher3.info

3. Результат выполнения задания в файле way.xls