Учебная страничка Васюткиной Ольги | |||||
|
|||||
Работа в EMBOSSПрограмма getorf
Вначале был получен файл с записью D89965 банка EMBL. getorf - программа для поиска открытых рамок считывания в последовательности нуклеотидов.
Опция -minsize задает минимальное число нуклеотидов в рамке.
Чтобы искать только те рамки, которые начинаются со старт-кодона и заканчиваются стоп-кодоном, используется опция -find 1. В записи EMBL есть ссылка на запись о белке в Swiss-Prot, AC P0A7B8. Файл: hslv_ecoli.entret. Это последовательность белка протеазы E.coli. Она частично совпадает с рамкой считывания [294..1]. Скорее всего, при получении ДНК из желудка крысы в образец попала ДНК бактерии E.coli, которая в норме обитает в кишечнике. И в результате именно бактериальная ДНК была секвенирована. |
|||||
Файлы-спискиДля начала нужно было получить все последовательности алкогольдегидрогеназ, доступные в Swiss-Prot: |
|||||
Случайная модель для оценки достоверности выравниванияИз файла с последовательностями алкогольдегидрогеназ была выбрана одна из организма Neurospora crassa, это гриб из отдела аскомицетов.
Программа shuffleseq создает нужное количество случайных последовательностей той же длины и с тем же набором букв, что и в исходной последовательности. |
|||||
Рис. 1. Гистограмма распределения весов выравниваний белковых последовательностей |
|||||
Вес выравнивания с исходной последовательностью равен 267.0. Он оказался в крайнем правом месте гистограммы. Здесь и далее значение веса исходного выравнивания отмечены красным. Его значение почти в 3 раза превышает предыдущее. Значит, полученное выравнивание сильно отличается от случайного, то есть можно утверждать о гомологии последовательностей. Далее было сделано то же самое для последовательностей генов. Для этого были использованы ссылки на базу данных EMBL в записях. У мыши ссылок оказалось очень много: DR EMBL; M18480; AAA37178.1; -; Genomic_DNA. DR EMBL; M18472; AAA37178.1; JOINED; Genomic_DNA. DR EMBL; M18473; AAA37178.1; JOINED; Genomic_DNA. DR EMBL; M18474; AAA37178.1; JOINED; Genomic_DNA. DR EMBL; M18475; AAA37178.1; JOINED; Genomic_DNA. DR EMBL; M18476; AAA37178.1; JOINED; Genomic_DNA. DR EMBL; M18477; AAA37178.1; JOINED; Genomic_DNA. DR EMBL; M18478; AAA37178.1; JOINED; Genomic_DNA. DR EMBL; M22679; AAA37179.1; -; Genomic_DNA. DR EMBL; M22671; AAA37179.1; JOINED; Genomic_DNA. DR EMBL; M22672; AAA37179.1; JOINED; Genomic_DNA. DR EMBL; M22673; AAA37179.1; JOINED; Genomic_DNA. DR EMBL; M22674; AAA37179.1; JOINED; Genomic_DNA. DR EMBL; M22675; AAA37179.1; JOINED; Genomic_DNA. DR EMBL; M22676; AAA37179.1; JOINED; Genomic_DNA. DR EMBL; M22677; AAA37179.1; JOINED; Genomic_DNA. DR EMBL; M11307; AAA37180.1; -; mRNA. DR EMBL; BC013477; AAH13477.1; -; mRNA. DR EMBL; BC054467; AAH54467.1; -; mRNA. DR EMBL; Z32540; -; NOT_ANNOTATED_CDS; Genomic_DNA. DR EMBL; M22611; AAA37181.1; -; mRNA. Я работала с двумя записями из первой строки ссылок: m18480.embl, aaa37178.embl. Получились заметно различающиеся результаты. Гистограмма для первого выравнивания показана на рис.2, для второго - на рис. 3. |
|||||
Рис. 2. Гистограмма распределения весов выравниваний последовательностей генов |
|||||
Рис. 3. Гистограмма распределения весов выравниваний последовательностей генов |
|||||
218.5, 901.5 - веса исходных выравниваний. |
© Olga Vasyutkina, 2013-2014
Дата последнего изменения: 08.11.2014
Задавайте вопросы по электронной почте