Учебный сайт Птицыной Елены

Cтудентки первого курса факультета биоинженерии и биоинформатики Московского государственного университета имени М.В. Ломоносова

Семестр 3, практикум 7

Назад на учебную страницу Птицыной Елены

Нуклеотидные банки данных

В этом практикуме мы учились использовать нуклеотидные банки данных.

Задание 1. NCBI Genome

Большая синица (Parus major) - самая крупная синица, достигающая 14 см (рис. 1) [1]. Другое её название - синица-кузнечик (устар.), потому что пение большой синицы можно сравить с мерными ударами молота по наковальне.

Parus major
Рисунок 1. Большая синица, или синица-кузнечик [2].

Большая синица имеет наибольший ареал среди синиц и множество подвидов. Например, в южном Средиземноморье можно найти несколько подвидов с мощными клювами и коготками, образованные предковой формой, тесно связанной с буковыми лесами. В Англии и Ирландии есть особый английский подвид, в других районах Европы и в Европейской части России так называемый северный подвид, с отступлением ледником распространившийся в Сибирь [3].

Ареал
Рисунок 1. Ареал большой синицы [3].

Людовик Баварский учреждал «большой штраф для любого, кто осмелится убить синицу — самого усердного истребителя насекомых» (приказ 1328 года) [6].

Для синицы-кузнечика известна одна сборка генома (см. Таблицу 1).

Таблица 1. Информация о сборке. Ссылка на публикацию: Evolutionary signals of selection on cognition from the great tit genome and methylome. Ссылки на bioproject: PRJNA312399 , PRJNA208335
Название (assembly name); Parus_major1.1
AC сборки из RefSeq GCF_001522545.3
AC сборки из GenBank GCA_001522545.3
"уровень" сборки (assembly level) Chromosome
общая длина последовательности 1,020,310,769
число контигов 24,044
N50 и L50 для контигов 148,693 и 1,868
число скэффолдов 1,675
N50 и L50 для скэффолдов 71,365,269 и 5
число аннотированных белков 39666

Была скачана последовательность одного из контигов в формате .fasta .

Задание 2. NCBI Nucleotide

Fuselloviridae - семейство вирусов с оболочкой лимоновидной формы, естественными хозяевами которых служат археи рода Sulfolobus, живущие в вулканических источниках.

В NCBI , выбрав базу Nucleotide, мы искали геномы вирусов семейства Fuselloviridae, длиной 10000-20000. Текст запроса: ((Fuselloviridae[Organism]) AND 10000:20000[Sequence Length]) AND "Complete Genome" . В Genbank было 45 находок, в Refseq 9 (это указано в левой панели страницы под заголовком Source databases). Выбран Sulfolobus spindle-shaped virus 5.

При нажатии на ссылку в списке находок открывается страница, некоторая страница с которой приведена в Таблице 2 (см. Таблицу 2).

Рядом с заголовком справа есть строчка "Send to", при нажатии на которую открывается окошко, в котором можно поставить точку на "Coding Sequences" и выбрать формат FASTA Nucleotide, далее нажать Create File. Тогда мы скачаем файл с участками генома, предположительно кодирующими белки (CDS). Он скачивается как .txt, потом можно придать ему .fasta.

Таблица 2. Информация о нуклеотидной записи.
AC нуклеотидной записи (ACCESSION) EU030939
латинское название вида (SOURCE – ORGANISM) Sulfolobus spindle-shaped virus 5
TaxID вида (FEATURES – source - /db_xref) 459291
тип генома dsDNA, кольцевая

Задание 3. NCBI Nucleotide

Информация взята из документа с сайта INSDC .

Таблица 3. Некоторые ключи таблицы особенностей.
Feature Key Definition
source Описание источника определённого промежутка последовательности. Может быть несколько sources.
     source          1..16565
                     /organism="Homo sapiens neanderthalensis"
                     /organelle="mitochondrion"
                     /mol_type="genomic DNA"
                     /sub_species="neanderthalensis"
                     /db_xref="taxon:63221"
                     /tissue_type="bone fossil"
                     /country="Croatia"
                     /common="Neandertal"
[5]
repeat_region Последовательность, содержащая повторяющиеся участки.
     repeat_region   1375..1408
                     /rpt_family="(GAAA)n"
[4]
misc_feature Последовательность, представляющая биологический интерес, но не характеризуемая имеющимися ключами. Её особенности уточняются после /note=.
     misc_feature    1..402
                     /note="similar to Homo sapiens EST BE466169 (NID:g9511944)
                     hz60c06.x1"
[4]
gene Участок, достоверно идентифицированный как ген.
     gene            573..643
                     /gene="trnF"
                     /db_xref="GeneID:6775088"
[5]
CDS Последовательность, кодирующая белок.
     CDS             4465..5506
                     /gene="ND2"
                     /note="TAA stop codon is completed by the addition of 3' A
                     residues to the mRNA"
                     /codon_start=1
                     /transl_except=(pos:5506,aa:TERM)
                     /transl_table=2
                     /product="NADH dehydrogenase subunit 2"
                     /protein_id="YP_002124303.1"
                     /db_xref="GeneID:6775094"
                     /translation="MNPLAQPVIYSTIFAGTLITALSSHWFFTWVGLEMNMLAFIPVL
                     TKKMNPRSTEAAIKYFLTQATASMILLMAILFNNMLSGQWTMTNTTNQYSSLMIMMAM
                     AMKLGMAPFHFWVPEVTQGTPLTSGLLLLTWQKLAPISIMYQISPSLNVSLLLTLSIL
                     SIMAGSWGGLNQTQLRKILAYSSITHMGWMMAVLPYNPNMTILNLTIYIILTTTAFLL
                     LNLNSSTTTLLLSRTWNKLTWLTPLIPSTLLSLGGLPPLTGFLPKWAIIEEFTKNNSL
                     IIPTIMATITLLNLYFYLRLIYSTSITLLPMSNNVKMKWQFEHTKPTPFLPTLITLTT
                     LLLPISPFMLMVL"
[5]
tRNA Последовательность длиной 75-85 нуклеотидов, кодирующая зрелую транспортную РНК.
     tRNA            573..643
                     /gene="trnF"
                     /product="tRNA-Phe"
                     /db_xref="GeneID:6775088"
[5]
rRNA Последовательность, кодирующая рибосомальную РНК.
     rRNA            644..1597
                     /gene="12S rRNA"
                     /product="12S ribosomal RNA"
                     /db_xref="GeneID:6775087"
[5]
D-loop Displacement loop - область митохондриальной ДНК, с одной из цепей которой может взаимодействовать участок РНК, вытесняя другую цепь.
     D-loop          complement(join(1..572,16019..16565))
[5]

Источники:
1. http://ecosystema.ru/08nature/birds/171.php
2. https://ru.wikipedia.org/wiki/%D0%91%D0%BE%D0%BB%D1%8C%D1%88%D0%B0%D1%8F_%D1%81%D0%B8%D0%BD%D0%B8%D1%86%D0%B0
3. http://ornithology.su/books/item/f00/s00/z0000052/st063.shtml
4. https://www.ncbi.nlm.nih.gov/nuccore/AC073210.8
5. https://www.ncbi.nlm.nih.gov/nuccore/NC_011137.1
6. http://obshe.net/posts/id1248.html