Сравнительный анализ протеомов бактерий Bacteroides thetaiotaomicron VPI-5482 и Escherichia coli (штамм K12) с помощью программ пакета EMBOSS |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Главная | Обо мне | Официальный сайт ФББ | Семестр I | Семестр II | Семестр III | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Задание 1. Частоты остатков в протеомах
КомментарийТри наиболее часто встречающихся остатка в протеоме Bacteroides thetaiotaomicron VPI-5482 - L (лейцин), I (изолейцин) и A (аланин). Для протеома Escherichia coli - это L (лейцин), A (аланин) и G (глицин). Наиболее редкими для Bacteroides thetaiotaomicron VPI-5482 являются W (триптофан), C (цистеин) и U (селеноцистеин), замечу, что последний тип вообще не встречается. Для E. coli U (селеноцистеин), С (цистеин) и W (триптофан) также являются самыми редко встречающимися. Таким образом, U, C и W - наиболее редкие для обоих организмов, а L - самый часто встречающийся аминокислотный остаток как у Bacteroides thetaiotaomicron VPI-5482, так и у E. coli. Наибольшая разница по абсолютной величине (2,6736) в частотах наблюдается для остатков аланина. Программа compseqCompseq и wordcount похожи по синтаксису: <входной файл> -word <длина слова> <выходной файл>. Программа compseq считает количество уникальных слов заданной длины в последовательности (особенность - выдача в выходной файл наблюдаемой и ожидаемой частот встречаемости слова). Выходной файл в compseq содержит расширенную информацию: слово данного типа (Word), количество слов в файле (Obs Count), наблюдаемая частота встречаемости (Obs Frequency), предполагаемая частота встречаемости (Exp Frequency), последняя колонка - их соотношение (Obs/Exp Frequency). Wordcount выдает лишь само слово и его частоту. Важно отметить, что команда compseq имеет ограничения на длину слов. Еще одно отличие программ - значения в выходном файле в wordcount упорядочены в порядке убывания, а в compseq - по алфавиту. Кроме того, в compseq более широкий список квалификаторов. Я полагаю, что наиболее оптимальной программой для выполнения этого практикума была бы compseq так как в ней доступно больше функций, но также она работает примерно в 10 (compseq ≈0.5 сек, wordcount ≈5 сек) раз быстрее. Источники:[1] Manned.org[2] Emboss.sourceforge.net |
© Marina Gladkova, 2016