Главная (Main)

Программа getorf. Поиск гомологов некодирующих последовательностей.

1. Работа с программой getorf пакета EMBOSS

Командная строка: getorf -minsize 30 -find 1 -table 0

5-ая рамка,соответствует приведённой в поле FT кодирующей последовательности (CDS):

>D89965_5 [163 - 432] Rattus norvegicus mRNA for RSS, complete cds.

MALMHFQFTFKQFEQRKSIRSTARKARDDFVVVQTADLFHVAFHYGIAQRGLTITSDDHMAVTAYAYYSCHELTPWLRIQSTNPVQKYGA

9-ая открытая рамка считывания соответствует последовательности белка HSLV_ECOLI:

>D89965_9 [294 - 1] (REVERSE SENSE) Rattus norvegicus mRNA for RSS, complete cds.

MKGNVKKVRRLYNDKVIAGFAGGTADAFTLFELFERKLEMHQGHLVKAAVELAKDWRTDRMLRKLEALLAVADETASLIITGNGDVVQPENDLIAIGS.

Заметим, что последовательность из Swiss-Prot гораздо длиннее рамки, причём обеих сторон. Такое несоответствие можно объяснить тем, что кодирующая последовательность в записи EMBL была определена неправильно: вместо крысы была отсеквенирована кишечная палочка, которая жила в её пищеварительном тракте.

2 и 3. Поиск гомологов некодирующих последовательностей программой BLASTN

Поиск гомологов при изменённых параметрах программы BLASTN

Результаты работы представлены в виде таблицы trna.xls

Командная строка для blastn:

blastn -task blastn -query trna_bacsu.fasta -db sa -evalue 0.01 -out trna_sa -outfmt 6

Командная строка для замены весовой матрицы:

blastn -task blastn -query trna_bacsu.fasta -db sa -evalue 0.01 -out trna2 -outfmt 6 -reward 5 -penalty -4 -gapopen 10 -gapextend 6

Командная строка при минимальном значении word size:

blastn -task blastn -query trna_bacsu.fasta -db sa -evalue 0.01 -out trna3 -outfmt 6 -reward 5 -penalty -4 -gapopen 10 -gapextend 6 -word_size 4

4. Анализ результатов

Число найденных гомологов при изменении параметров расчёта веса выравнивания и изменении длины слова увеличивается.

Пара не находится программой BLAST при стандартных параметрах и изменении весовой матрицы,но находится при замене параметра -word_size (так как он менее ограничивающий из указанных):

BSn5_t20894	embl|AL766854|AL766854	70.59	68	20	0	2	69	20362	20429	1e-05	41.57

Выравнивание needle

BSn5_t20894        1 ---------------------tg---ggctatagccaagcggtaaggcaa     26 
                                          ||   ||||||   |||   |||.|.|||        
AL766854           1 gcaactgcccttgagtttgcttggaaggctat---caa---gtatgtcaa     44 
                                                                               
BSn5_t20894       27 tggactttgact-ccgtgatcgttggtt-cgaatccagctagcccag     71    
                             |.|| .||.|||| |||||| |.||                         
AL766854          45 --------gtctaacgggatc-ttggttgccaa--------------     68    

Характеристики выравнивания:

Length: 97                            
Identity:      36/97 (37.1%)
Similarity:    36/97 (37.1%)
Gaps:          55/97 (56.7%)
Score: 79.5                 

Судя по выравниванию, у которого процент идентичности и сходства не высоки, зато процент гэпов высок, данные участки последовательности не гомологичны. В поле FT записи EMBL, описывающей геном бактерии, про данный гомологичный участок сказано, что он кодирует tRNA-Cys, а ен из B.subtilis кодирует tRNA-Gln


© Лунева Анна