Нуклеотидные банки данных

Главная Семестры Проекты Заметки О себе Полезные ссылки


Задание 1.

Ниже представлен список хромосом из Saccharomyces cerevisiae, найденный с помощью SRS.

REFSEQ_DNA:NC_001133	NC_001133	Saccharomyces cerevisiae S288c chromosome I, complete sequence. 	230218	
REFSEQ_DNA:NC_001134	NC_001134	Saccharomyces cerevisiae S288c chromosome II, complete sequence. 	813184	
REFSEQ_DNA:NC_001135	NC_001135	Saccharomyces cerevisiae S288c chromosome III, complete sequence. 	316620	
REFSEQ_DNA:NC_001136	NC_001136	Saccharomyces cerevisiae S288c chromosome IV, complete sequence. 	1531933	
REFSEQ_DNA:NC_001137	NC_001137	Saccharomyces cerevisiae S288c chromosome V, complete sequence. 	576874	
REFSEQ_DNA:NC_001138	NC_001138	Saccharomyces cerevisiae S288c chromosome VI, complete sequence. 	270161	
REFSEQ_DNA:NC_001139	NC_001139	Saccharomyces cerevisiae S288c chromosome VII, complete sequence. 	1090940	
REFSEQ_DNA:NC_001140	NC_001140	Saccharomyces cerevisiae S288c chromosome VIII, complete sequence. 	562643	
REFSEQ_DNA:NC_001141	NC_001141	Saccharomyces cerevisiae S288c chromosome IX, complete sequence. 	439888	
REFSEQ_DNA:NC_001142	NC_001142	Saccharomyces cerevisiae S288c chromosome X, complete sequence. 	745751	
REFSEQ_DNA:NC_001143	NC_001143	Saccharomyces cerevisiae S288c chromosome XI, complete sequence. 	666816	
REFSEQ_DNA:NC_001144	NC_001144	Saccharomyces cerevisiae S288c chromosome XII, complete sequence. 	1078177	
REFSEQ_DNA:NC_001145	NC_001145	Saccharomyces cerevisiae S288c chromosome XIII, complete sequence. 	924431	
REFSEQ_DNA:NC_001146	NC_001146	Saccharomyces cerevisiae S288c chromosome XIV, complete sequence. 	784333	
REFSEQ_DNA:NC_001147	NC_001147	Saccharomyces cerevisiae S288c chromosome XV, complete sequence. 	1091291	
REFSEQ_DNA:NC_001148	NC_001148	Saccharomyces cerevisiae S288c chromosome XVI, complete sequence. 	948066	 


Хромосома IV

Количество тРНК:28
Длина:1531933
Количество генов:788

Примеры четырёх генов на хромосоме:

- ген, который находится на прямой цепи и не имеет интронов: CDS:5985..7814 gene="MPH2"
- ген, который находится на обратной цепи и не имеет интронов: CDS:8683..9756 gene="SOR2"
- ген, который находится на прямой цепи и имеет хотя бы один интрон: CDS: join(65242..65306,65378..65765) gene="DTD1"
- ген, который находится на обратной цепи и имеет хотя бы один интрон: CDS: (join(239019..239398,239510..239606)) gene="HNT1"

Задание 2.

С помощью команды entret embl: mrga_bacsu узнаем AC: L19547

Определим границы кодирующего участка. Воспользуемся командой entret embl:L19547, границы кодирующего участка: 467..928.
Воспользуемся командной seqret -sask для вырезания нужного фрагмента, получим файл.

Задание 3

Для сравнения выравниваний будем использовать белок с идентификатором Mrga_bacsu и его гомолог c идентификатором A7Z8L5_BACA2. С помощью программ получим следующие файлы с выравниванием:

Выравнивание последовательностей белков программой needle
Выравнивание последовательностей их генов программой needle
Выравнивание последовательностей их генов программой tranalign

Программа tranalign работает по принципу выравнивания нуклеотидных последовательностей по выравненным белковым, т.е. чем-то может быть схожа с needle для белков. В выдаче мы получаем именно кодирующие соответствующие белки части нуклеотидных последовательностей. Выравнивание needle нуклеотидных последовательностей содержит довольно много подряд идущих гэпов, что говорит о том, что это не очень хорошее выравнивание. Белковое выравнивание needle довольно хорошее, также, как и tranalign, т.к. практически не содержит гэпов. Это говорит о большем биологическом смысле, нежели в нуклеотидном выравнивании, т.к. белки состоят из большего алфавита (20 против всего 4 у нуклеотидов), а значит, что случайные совпадения происходят реже и выравнивание точнее.

Задание 4

Будем искать ген MRH2.При поиске можно пользоваться Advanced Search (т.е использовать больше входных данных для большей точности). Воспользуемся им, введем в поле "Organism" - Saccharomyces cerevisiae, в поле "gene name" - название гена MRH2. И, ура, мы получаем вторую ссылку. В меню справа можно проанализировать этот ген: пробластовать, создать и протестировать праймеры, используя primer-BLAST, получить данные об особенностях гена в таблице, что-нибудь найти в гене (паттерны). Несомненными плюсами также являетя возможность прочитать статьи об этом гене, узнать побольше о продукте гена, о его гомологах, перейти на Esembl и Genscript, Pubmed, а также посмотреть недавнюю инофрмацию об этом гене. Можно выбирать область, которую нужно показать и комплементарную ей. Однако, не хватает для полноты картины графической визуализации, которой довольно много встречается, например, в Esembl и MapViewer.