Зачетное задание

Дано: неаннотированный фрагмент генома бактерии Yersinia mollaretii Задача: определить, закодированы ли данном фрагменте какие-либо белки, похожие на известные белки родственной бактерии (кишечной палочки).
Начну выполнение задания с того, что с помощью seqret -sask вырежу из генома свой фрагмент.
Далее получу полный протеом E.coli с помощью команды seqret sw:*_Ecoli. Далее стоит создать индексные файлы для программ BLAST, для этого использую следующую команду:
formatdb -i ecoli_gen.fasta -p T -n gen
Программа создаст 3 индексных файла с названиями gen.

Далее получу трансляции открытых рамок считывания с помощью команды
getorf -minsize 240 -table 11 -find 1 -sequence aald01000001.fasta

Следующий шаг - поиск сходных последовательностей у кишечной палочки.
С помощью команды blastall -p blastp -d gen -i aald01000001.orf -e 0.001 -m 8 -o out1.txt получим файл, содержащий результаты поиска.
Был написан скрипт, позволяющий подсчитать количество сходных последовательностей. Результат работы скрипта.
На основе этих данных была составлена таблица

Схематическое положение на фрагменте тех открытых рамок, для которых нашлись сходные последовательности в E. coli.

5'--------------------------------------------[=>yceA, 3774-4841]--[=>tqsA,4945-6012]----------------------3'
3'-[<=mdtG, 1-1146]-----[<=htrB, 2106-3047]---------------------------------------------[<=rcsA,6494-6991]-5'

Сравнение взаимного расположения предполагаемых генов данного фрагмента и гомологичных им генов в геноме кишечной палочки.


Гены в геноме E.coli

Гены rcsa и tqsa лежат далеко и не попали на данную схему.
5'--------------------------------------------------[yceA, 1116030-1117082]-------------3'
3'-[mdtg, 1113487-1114713]-[htrb, 1114885-1115805]--------------------------------------5'
Главная страница
Второй семестр
Первый семестр

©Арутюнов Артём

©Photo exclusiely made by myself :)

©Я в контакте