Задание 1. Работа с программой getorf пакета EMBOSS Для получения набора трансляций всех открытых рамок D89965 банка EMBL последовательности длиной более 30 нуклеотидов,
считая открытой рамкой последовательность триплетов, начинающуюся со старт-кодона и заканчивающуюся стоп-кодоном,
при использовании стандартного кода выполнялась команда:
Одна из полученных открытых рамок, соответствующая кодирующей последовательности в поле FT записи D89965:
Файл с последовательностью записи Swiss-Prot, на которую ссылается данная запись EMBL - P0A7B8 (HSLV_ECOLI).
Выясним, какой из полученных открытых рамок соответствует эта последовательность.
Для этого запустим blastp по выдаче getorf (blastp -query HSLV_ECOLI -subject d89965.orf -out HSLV_d89965). Удовлетворяющая требованиям находка:
таким образом, последовательности из Swiss-Prot соответствует 9 рамка.
Задание 2. Поиск гомологов некодирующих последовательностей программой BLASTN Таблица, с результатами. Текст cкрипта для выполнения задания. Задание 3. Поиск гомологов при изменённых параметрах программы BLASTN В первый раз менялась весовая матрица:
Во второй раз менялась еще и длина слова на минимально возможную :
Таблица с результатами этого задания представлена в задании 2. Задание 4. Анализ результатов При изменении значений -reward и -penalty от 2 до 5 и -3 до -4 соответственно в большинстве случаев число гомологов увеличилось или не изменилось. Однако встречалось и уменьшение числа гомологов, но таких случаев было гораздо меньше. При уменьшении дли слова количество гомологов увеличилось, и лишь в незначительном количестве случаев не изменилось. Для анализа программой needlе были выбрана пара гомологов, которая есть при весовой матрице с парамтрами -reward 5 и -penalty -4, но отсутствует при стандартных значениях этих параметров.
Это BSn5_t20966 на участке 5-63 и AL591977 на 46660-46717
В результате парного выравнивания:
Гомологичный участок является частью последоваетельности, продуктом которой является tRNA-Asn (в соответствии с полем FT записи EMBL, описывающей геном бактерии). Продуктом же BSn5_t20966 является tRNA-Ile. Так как важным критерием установления гомологичности является аналогичность биологической функции, то эти две последовательности (кодирующие аспарагиновую и изолейциновую тРНК) вряд ли можно назвать гомологичными. А нахождение их blastn, возможно, по большей части обусловлено консервативностью tRNA в принципе. |