Главная |
Нуклеотидные банки данныхЗнакомство со структурой банка RefSeq посредством поисковой системы SRS В первом задании нам было предложено ознакомиться с поисковой системой SRS и найти информацию о хромосомах Saccharomyces cerevisiae. Список хромосом представлен ниже: REFSEQ_DNA:NC_001133 NC_001133 Saccharomyces cerevisiae S288c chromosome I, complete sequence. 230218 REFSEQ_DNA:NC_001134 NC_001134 Saccharomyces cerevisiae S288c chromosome II, complete sequence. 813184 REFSEQ_DNA:NC_001135 NC_001135 Saccharomyces cerevisiae S288c chromosome III, complete sequence. 316620 REFSEQ_DNA:NC_001136 NC_001136 Saccharomyces cerevisiae S288c chromosome IV, complete sequence. 1531933 REFSEQ_DNA:NC_001137 NC_001137 Saccharomyces cerevisiae S288c chromosome V, complete sequence. 576874 REFSEQ_DNA:NC_001138 NC_001138 Saccharomyces cerevisiae S288c chromosome VI, complete sequence. 270161 REFSEQ_DNA:NC_001139 NC_001139 Saccharomyces cerevisiae S288c chromosome VII, complete sequence. 1090940 REFSEQ_DNA:NC_001140 NC_001140 Saccharomyces cerevisiae S288c chromosome VIII, complete sequence. 562643 REFSEQ_DNA:NC_001141 NC_001141 Saccharomyces cerevisiae S288c chromosome IX, complete sequence. 439888 REFSEQ_DNA:NC_001142 NC_001142 Saccharomyces cerevisiae S288c chromosome X, complete sequence. 745751 REFSEQ_DNA:NC_001143 NC_001143 Saccharomyces cerevisiae S288c chromosome XI, complete sequence. 666816 REFSEQ_DNA:NC_001144 NC_001144 Saccharomyces cerevisiae S288c chromosome XII, complete sequence. 1078177 REFSEQ_DNA:NC_001145 NC_001145 Saccharomyces cerevisiae S288c chromosome XIII, complete sequence. 924431 REFSEQ_DNA:NC_001146 NC_001146 Saccharomyces cerevisiae S288c chromosome XIV, complete sequence. 784333 REFSEQ_DNA:NC_001147 NC_001147 Saccharomyces cerevisiae S288c chromosome XV, complete sequence. 1091291 REFSEQ_DNA:NC_001148 NC_001148 Saccharomyces cerevisiae S288c chromosome XVI, complete sequence. 948066 Далее была найдена информация о заданной хромосоме (мне досталась хромосома под номером VIII). В данной хромосоме закодировано 282 белка (пункт CDS описания гена), 11 тРНК (пункт tRNA описания гена). В описании хромосомы VIII были найдены гены, отвечающие заданным требованиям:
Получение последовательности, кодирующей заданный белок Были найдены AC и ID для белка с идентификатором базы данных RefSeq Protein YP_909930.1 с помощью сервиса сайта UniProt: A1A2B5 и A1A2B5_BIFAA соответственно. С помощью команды пакета EMBOSS entret uniprot:A1A2B5_BIFAA -autoбыл получен идентификатор данного белка в безе данных EMBL (находится в одной из строк полученного файла a1a2b5_bifaa.entret): AP009256. За ним следует идентификатор записи, содержщей информацию о последовательности конретного белка и его гена: BAF39848.1. Были получены соответствующие файлы:ap009256.entret, baf39848.entret С помощью команды: seqret -sask ap009256.entretбыл получен файл, содержащий последовательность кодирующей последовательности (CDS) гена белка в формате fasta (координаты CDS: complement(AP009256.1:1325857..1326837)). Файл можно скачать по следущей ссылке: ap009256.fasta Выравнивание белков и их генов В качестве гомолога для построения выравнивания был выбран белок с идентификатором EMBL EFH27691.1 (белок хоризмат мутазы организма Gardnerella vaginalis). Файл с описанием белка и его гена можно скачать по ссылке: efh27691.entret Было призведено выравнивание последовательностей белков с помощью программы needle пакета EMBOSS. Выравнивание представлено на рис.1. Было призведено выравнивание последовательностей генов белков с помощью программы needle пакета EMBOSS. Выравнивание представлено на рис.2 Также было призведено выравнивание последовательностей белков с помощью программы tranalign пакета EMBOSS. Выравнивание представлено на рис.3 Как видно из рис. 1 и рис. 3. выравнивания, полученные с помощью needle и tranalign. Выравнивание, полученное с помощью tranalign содержит в себе больше гэпом и по этой причине длинее. С другой стороны, количество гэпов кратно трём (соответствует размеру кодона). Так как выравнивание, полученное с помощью tranalign, строится на основе выравнивания аминокислот, можо полагать, что оно несёт больший биологический смысл, чем выравнвиание, полученное с помощью needle. Поиск в нуклеотидном банке NCBI по имени гена Ссылка на публичную коллекцию с результатами поиска последовательности гена COS8 в нуклеотидной базе данных NCBI. Среди результатов были ссылки на последовательности целых дрожжевых хромосом, а также на последовательности генов организмов, не относящихся к дрожжам (B.burgdorferi - спирохета). С другой стороны предоставлялась возможность выбрать ссылку, связанную с конкретным объектом (РНК, белок и т.п.). Но избыток лишней информации и перекрёстных ссылок делает этот ресурс неудобным для поиска конкретной информации об определённом гене. |
Обо мне | |
Семестры | |
Ссылки | |