Учебный сайт Ксении Худяковой

Главная
Семестры
Обо мне
Ссылки

Задание 1.
Вначале был получен файл с записью D89965 банка EMBL.

entret embl:D89965
Это ген белка серой крысы, отвечающий за серотониновую передачу в желудке. Далее я попросила программу getorf найти открытые рамки считывания в этом гене, причем только те, которые начинаюся со старт-кодона и заканчиваются стопом и те, которые имеют длину не менее 90 нуклеотидов. getorf d89965.entret -find 1 -minsize 90 Получен файл d89965.orf Одна из найденных orf [163..432] почти полностью совпадает с той, что указана в CDS. В записи EMBL есть ссылка на запись о белке в Swiss-Prot, AC P0A7B8. Файл: hslv_ecoli.entret. Это последовательность белка протеазы E.coli. Она частично совпадает с рамкой считывания [294..1]. Видимо, случайно была сиквенирована ДНК E.coli, обитающей в кишечнике.

Задание 2.
Скачаны все доступные в Swiss-Prot последовательности алкогольдегидрогеназ. Полученный файл - adh.fasta. Команда:

seqret sw:adh*_* adh.fasta
Получен файл-список usa.txt, содержащий универсальные адреса (USA) этих последовательностей. Использована программа infoseq, запущенная с параметрами -only и -usa. Команда:
infoseq adh.fasta -only -usa -out usa.txt
Теперь мне нужно отобрать последовательности только нескольких организмов (DROTS DROMA ECO57 METM7 MYCTO DROMU SCYCA). Сначала я создала их список list.txt Затем команда:
grep -f list.txt usa.txt > org_usa.txt
В результате был сформирован файл-список адресов последовательностей из нужных мне организмов org_usa.txt Следующая команда:
seqret @org_usa.txt seq.fasta
Результат - файл с нужными последовательностями seq.fasta

Задание 3.
Стандартный приём для оценки достоверности вывода о реальности эффекта или факта на основе наблюдения – сравнение со случайной моделью. В нашем случае "факт" – гомология последовательностей, а "наблюдение" – вес их выравнивания. (цитата формулировки задания) Я выбрала алкогольдегидрогеназы Mycobacterium tuberculosis (MYCTO) и Scyliorhinus canicula (Кошачья акула, scyca). Я выбрала их как самых далеких друг от друга организмов из "моего" списка. Теперь нужно сгенерировать случайные последовательности той же длины и из того же набора букв, что и у алкогольдегидрогеназы.

shuffleseq -shuffle 100 ADHD_MYCTO.fasta shuffled_MYCTO.fasta
Файлы: ADHD_MYCTO.fasta shuffled_MYCTO.fasta Теперь воспользуемся программой water для того, чтобы сделать сто выравниваний случайных последовательностей с последовательностью акулы. А вторая строка сделает выравнивание двух настоящих последовательностей.
water sw:ADHX_SCYCA shuffled_MYCTO.fasta
water sw:ADHX_SCYCA sw:ADHD_MYCTO
Результаты: first, second
Результаты педставлены в виде гистограммы. По оси Х вес выравнивания, по оси У количество выравниваний с такими весами.

Вес выравнивания с исходной последовательностью равен 563. Он оказался в крайнем правом месте гистограммы. Его значение почти в 6 раз превышает предыдущее. Значит, полученное выравнивание сильно отличается от случайного, то есть можно утверждать о гомологии последовательностей.