|
||||||
Главная | Семестры | Скрипты | Обо мне | Ссылки |
|
|
Предсказание генов у прокариот Для выполнения этого практикума мне был дан контиг микробиома кардиального отдела желудка валлаби. А заданием было определение границ белок-кодирующих генов. Первый метод - использование ORF Finder - программы выполняющей поиск открытых рамок считывания. Для данного задания я использовала бактериальный генетический код. Всего было найдено 19 предположительных генов. В действительности таковыми является 2, на мой взгляд. Они покрашены зеленым на рисунке 1. Рисунок 1. Результат работы программы ORF Finder. Ярко зеленым выделены достоверные, на мой взгляд, находки Я сделала такой вывод из поиска гомологов в базе данных SwissProt. Кроме того, важным является тот факт, что у бактерий гены практически не перекрываются. Для самого длинного фрагмента, с 916 по 2082 нуклеотиды, было найдено множество гомлогов с достаточно низкими E-value. Большая часть этих белков - бутанол-дегидрогеназы, также встречаются бутанол дегидрогеназы и белки, названные алкоголь-дегидрогеназами. Например, одним из гомологов является НАДН-зависимая бутанол-дегидрогеназа А, идентификатор O05239, из бактерии Bacillus subtilis (strain 168). E-value находки 3e-104. Выравнивание этих последовательностей можно посмотреть здесь. Также гомологи с высокой достоверность найдены для третьей по длине находки (2788-2969). Это белки семейства НАД- и НАДН-зависимых оксидоредуктаз. Гомолог со значением E-value 6e-13 той же бактерии Bacillus subtilis (strain 168) оксидоредуктаза YxbG, идентификатор P46331. Выравнивание последовательностей представлено здесь. Для других открытых рамок гомологов с E-value ниже 0,001 не был найдено. Краткая информация о лучших находках представлена в таблице 1. Таблица 1.Лучшие результаты ORF Finder
Другим методом предсказания генов является программа GeneMark. Рузельтатом работы этой программы было четыре находки, данные представлены в таблице 2. Все 4 гена также были предсказаны в предыдущем задании. Оба гена, отмеченные мной ранее как достоверные были определены, это 3 и 4 находки. Таблица 2.Результаты GeneMark
Здесь можно посмотреть график кодирующего потенциала, полученнего программой GeneMark, более толстыми полосами выделены наиболее достоверные белок-кодирующие участки. Большинство остальны пиков приходится на области, распознанные ORF Finder как гены. Из этого можно сделать вывод, что алгоритм программы GeneMark более надежный, требует меньшей дополнительной работы по поиску гомологов. А на данном примере важные находки потеряны не были, что очень важно. Таким образом, гены, представленные в таблице 1, вероятнее всего достоверно кодируют белки. |
||||||||||||||||||||||||||||||||||||||||||||||||||
© Pogorelskaya Sasha | Last modification date: 19.02.15 |