Getorf

Чтобы получить набор трансляций всех открытых рамок данной последовательности длиной более 30 нуклеотидов, считая открытой рамкой последовательность триплетов, начинающуюся со старт-кодона и заканчивающуюся стоп-кодоном, при использовании стандартного кода надо ввести:

getorf -sequence d89965.entret -outseq orf_out -minsize 30 -find 1

Пятая найденная рамка соответствует соответствует приведённой в поле FT кодирующей последовательности (CDS).

Девятая найденная рамка является частью записи Swiss-Prot P0A7B8(HSLV_ECOLI) гена элемента АТФ-зависимой протеазы из Escherichia coli, штамм К12. Возможно так получилось, так как getorf взял минимальную рамку, поэтому концы белка остались неохваченными.

Задания 2 и 3.

Первый запуск - обычный

blastn -query trna_bacsu.fasta -db lm -out trna -evalue 0.01 -outfmt 6 -task blastn

Второй запуск - изменена весовая матрица

blastn -query trna_bacsu.fasta -db lm -out trna -evalue 0.01 -outfmt 6 -task blastn -reward 5 -penalty 4 -gapopen 10 -gapextend 6

Третий запуск - плюс изменено значение параметра -word_size

blastn -query trna_bacsu.fasta -db lm -out trna -evalue 0.01 -outfmt 6 -task blastn -reward 5 -penalty 4 -gapopen 10 -gapextend 6 -word_size 4

Результаты

Задание 4

При изменении параметров число гомологов, как правило, увеличилось, что вызвано тем, что при этом повушается чувствительность blastn и он выдает в том числе те последовательности, которые рашньше считались случайно схожими. Также к увеличению приводит и уменьшение -word_size 4, так как приэтом он выдает и более короткие последовательности.

Это выравнивание рамки BSn5_t20966 с поледовательностью AL591978, которое было найдено во втором и третьем поисках.

Этот участок не отличается высокой консервативностью, поэтому он мог быть не найден при первом поиске. Когда при втором поиске чувствительност повысилась, этот участок нашли.

На главную


©Tsepkova Polina