|
||||||
Задание 1. entret embl:D89965Это ген белка серой крысы, отвечающий за серотониновую передачу в желудке. Далее я попросила программу getorf найти открытые рамки считывания в этом гене, причем только те, которые начинаюся со старт-кодона и заканчиваются стопом и те, которые имеют длину не менее 90 нуклеотидов. getorf d89965.entret -find 1 -minsize 90 Получен файл d89965.orf Одна из найденных orf [163..432] почти полностью совпадает с той, что указана в CDS. В записи EMBL есть ссылка на запись о белке в Swiss-Prot, AC P0A7B8. Файл: hslv_ecoli.entret. Это последовательность белка протеазы E.coli. Она частично совпадает с рамкой считывания [294..1]. Видимо, случайно была сиквенирована ДНК E.coli, обитающей в кишечнике.
Задание 2. seqret sw:adh*_* adh.fastaПолучен файл-список usa.txt, содержащий универсальные адреса (USA) этих последовательностей. Использована программа infoseq, запущенная с параметрами -only и -usa. Команда: infoseq adh.fasta -only -usa -out usa.txtТеперь мне нужно отобрать последовательности только нескольких организмов (DROTS DROMA ECO57 METM7 MYCTO DROMU SCYCA). Сначала я создала их список grep -f list.txt usa.txt > org_usa.txtВ результате был сформирован файл-список адресов последовательностей из нужных мне организмов org_usa.txt Следующая команда: seqret @org_usa.txt seq.fastaРезультат - файл с нужными последовательностями seq.fasta
Задание 3. shuffleseq -shuffle 100 ADHD_MYCTO.fasta shuffled_MYCTO.fastaФайлы: ADHD_MYCTO.fasta shuffled_MYCTO.fasta Теперь воспользуемся программой water для того, чтобы сделать сто выравниваний случайных последовательностей с последовательностью акулы. А вторая строка сделает выравнивание двух настоящих последовательностей. water sw:ADHX_SCYCA shuffled_MYCTO.fasta water sw:ADHX_SCYCA sw:ADHD_MYCTO Результаты: first, secondРезультаты педставлены в виде гистограммы. По оси Х вес выравнивания, по оси У количество выравниваний с такими весами. Вес выравнивания с исходной последовательностью равен 563. Он оказался в крайнем правом месте гистограммы. Его значение почти в 6 раз превышает предыдущее. Значит, полученное выравнивание сильно отличается от случайного, то есть можно утверждать о гомологии последовательностей. |