Главная | Семестры | Проекты | Заметки | О себе | Полезные ссылки |
Задание 1.
Ниже представлен список хромосом из Saccharomyces cerevisiae, найденный с помощью SRS.
REFSEQ_DNA:NC_001133 NC_001133 Saccharomyces cerevisiae S288c chromosome I, complete sequence. 230218 REFSEQ_DNA:NC_001134 NC_001134 Saccharomyces cerevisiae S288c chromosome II, complete sequence. 813184 REFSEQ_DNA:NC_001135 NC_001135 Saccharomyces cerevisiae S288c chromosome III, complete sequence. 316620 REFSEQ_DNA:NC_001136 NC_001136 Saccharomyces cerevisiae S288c chromosome IV, complete sequence. 1531933 REFSEQ_DNA:NC_001137 NC_001137 Saccharomyces cerevisiae S288c chromosome V, complete sequence. 576874 REFSEQ_DNA:NC_001138 NC_001138 Saccharomyces cerevisiae S288c chromosome VI, complete sequence. 270161 REFSEQ_DNA:NC_001139 NC_001139 Saccharomyces cerevisiae S288c chromosome VII, complete sequence. 1090940 REFSEQ_DNA:NC_001140 NC_001140 Saccharomyces cerevisiae S288c chromosome VIII, complete sequence. 562643 REFSEQ_DNA:NC_001141 NC_001141 Saccharomyces cerevisiae S288c chromosome IX, complete sequence. 439888 REFSEQ_DNA:NC_001142 NC_001142 Saccharomyces cerevisiae S288c chromosome X, complete sequence. 745751 REFSEQ_DNA:NC_001143 NC_001143 Saccharomyces cerevisiae S288c chromosome XI, complete sequence. 666816 REFSEQ_DNA:NC_001144 NC_001144 Saccharomyces cerevisiae S288c chromosome XII, complete sequence. 1078177 REFSEQ_DNA:NC_001145 NC_001145 Saccharomyces cerevisiae S288c chromosome XIII, complete sequence. 924431 REFSEQ_DNA:NC_001146 NC_001146 Saccharomyces cerevisiae S288c chromosome XIV, complete sequence. 784333 REFSEQ_DNA:NC_001147 NC_001147 Saccharomyces cerevisiae S288c chromosome XV, complete sequence. 1091291 REFSEQ_DNA:NC_001148 NC_001148 Saccharomyces cerevisiae S288c chromosome XVI, complete sequence. 948066
Хромосома IV
Количество тРНК:28
Длина:1531933
Количество генов:788
Примеры четырёх генов на хромосоме:
- ген, который находится на прямой цепи и не имеет интронов: CDS:5985..7814 gene="MPH2"
- ген, который находится на обратной цепи и не имеет интронов: CDS:8683..9756 gene="SOR2"
- ген, который находится на прямой цепи и имеет хотя бы один интрон: CDS: join(65242..65306,65378..65765) gene="DTD1"
- ген, который находится на обратной цепи и имеет хотя бы один интрон: CDS: (join(239019..239398,239510..239606)) gene="HNT1"
Задание 2.
С помощью команды entret embl: mrga_bacsu узнаем AC: L19547
Определим границы кодирующего участка. Воспользуемся командой entret embl:L19547, границы кодирующего участка: 467..928.
Воспользуемся командной seqret -sask для вырезания нужного фрагмента, получим файл.
Задание 3
Для сравнения выравниваний будем использовать белок с идентификатором Mrga_bacsu и его гомолог c идентификатором A7Z8L5_BACA2. С помощью программ получим следующие файлы с выравниванием:
Выравнивание последовательностей белков программой needle
Выравнивание последовательностей их генов программой needle
Выравнивание последовательностей их генов программой tranalign
Программа tranalign работает по принципу выравнивания нуклеотидных последовательностей по выравненным белковым, т.е. чем-то может быть схожа с needle для белков. В выдаче мы получаем именно кодирующие соответствующие белки части нуклеотидных последовательностей. Выравнивание needle нуклеотидных последовательностей содержит довольно много подряд идущих гэпов, что говорит о том, что это не очень хорошее выравнивание. Белковое выравнивание needle довольно хорошее, также, как и tranalign, т.к. практически не содержит гэпов. Это говорит о большем биологическом смысле, нежели в нуклеотидном выравнивании, т.к. белки состоят из большего алфавита (20 против всего 4 у нуклеотидов), а значит, что случайные совпадения происходят реже и выравнивание точнее.
Задание 4
Будем искать ген MRH2.При поиске можно пользоваться Advanced Search (т.е использовать больше входных данных для большей точности). Воспользуемся им, введем в поле "Organism" - Saccharomyces cerevisiae, в поле "gene name" - название гена MRH2. И, ура, мы получаем вторую ссылку. В меню справа можно проанализировать этот ген: пробластовать, создать и протестировать праймеры, используя primer-BLAST, получить данные об особенностях гена в таблице, что-нибудь найти в гене (паттерны). Несомненными плюсами также являетя возможность прочитать статьи об этом гене, узнать побольше о продукте гена, о его гомологах, перейти на Esembl и Genscript, Pubmed, а также посмотреть недавнюю инофрмацию об этом гене. Можно выбирать область, которую нужно показать и комплементарную ей. Однако, не хватает для полноты картины графической визуализации, которой довольно много встречается, например, в Esembl и MapViewer.