Практикум 7. Банки нуклеотидных последовательностей.


Задание 1.


Рисунок 1. Falco peregrinus.


Таблица 1. Качество сборки генома Falco peregrinus.

Название видаFalco peregrinus
Сапсан
Число сборок генома2
Общая длина сборки1,112,064,469
Число контигов60,351
Число скаффолдов72
N5033,994
L509,833
Число аннотированных белков21,594
Ссылка не публикацию с описанием проекта https://genome.cshlp.org/content/27/5/875.long
Ссылка на последовательность одного из контиговВ RefSeq, к сожалению ничего нет.
Вот контиг MLQY01000001.1 из GenBank.


Задание 2.

Таблица 2. Описание семи Feature Key.

НазваниеОписаниеСсылка на запись, в которой
есть такой Feature Key
C_regionНевариабельный участок лёгкой или тяжелой цепи иммуноглобулинов/альфа, бета или гамма цепей Т-клеточного рецептора. Включает в себя один или нескольно экзонов....
mat_peptideПоследовательность белка-продукта посттрансляционной модификации. ...
mobile_elementМесто в геноме, содержащее мобильный элемент. ...
ncRNAГен, не кодирующий ни белок, ни транспортную или рибосомальную РНК. Считываемая функциональная молекула - РНК транскрипт. ...
operonРегион, содержащий полицистронный транскрипт, кластер генов с один промотором и, соответственно, с единой регуляцией транскрипции. Как правило, продукты этих генов задействованы в одном биохимическом пути. ...
oriTРегион в ДНК, в котором инициируется перенос ДНК от одной бактерии к другой во время коньюгации. ...
prim_transcriptТранскрипт до процессинга, может включать в себя ncRNA, rRNA, tRNA; 5'UTR, 3'UTR; а также экзоны и интроны ...


Задание 3.

Название проектаEarth Biogenome Project
Цели проекта1. Извлечение пользы для человечества.
2. Защита биоразнообразия.
3. Понимание функционирования экосистем.
Год начала2017
Ссылка на страницу...
Глава проектаХэррис Льюин, Калифорнийский университет
СтранаСША
Планируемое число геномов1,5 млн
Последняя публикация по проекту ...


Задание 4.

Поиск в ENA. Текст запроса: tax_tree(6231) AND mol_type="genomic DNA" AND topology="CIRCULAR" AND organelle="mitochondrion". Одна находка в Update и 310 - в Release. Выбранный организм: Cylicocyclus radiatus, AC записи: MH363701 (единственная Update).



Рисунок 2. Cylicocyclus radiatus.



Гены белков, закодированных в геноме:

короткое названиеполное названиекоординаты в геномеидентификатор
COX1cytochrome c oxidase subunit I1..1578AXS77374.1
COX2cytochrome c oxidase subunit II1853..2548AXS77375.1
ND3NADH dehydrogenase subunit 33578..3913AXS77376.1
ND5NADH dehydrogenase subunit 53932..5515AXS77377.1
ND6NADH dehydrogenase subunit 65964..6398AXS77378.1
ND4LNADH dehydrogenase subunit 4L6456..6689AXS77379.1
ND1NADH dehydrogenase subunit 17705..8577AXS77380.1
ATP6ATP synthase F0 subunit 68586..9185AXS77381.1
ND2NADH dehydrogenase subunit 29381..10226AXS77382.1
CYTBcytochrome b10517..11629AXS77383.1
COX3cytochrome c oxidase subunit III11703..12468AXS77384.1
ND4NADH dehydrogenase subunit 412525..13754AXS77385.1

© Belousova Evgenia, 2018