Семестр 3, практикум 7
Назад на учебную страницу Птицыной ЕленыНуклеотидные банки данных
В этом практикуме мы учились использовать нуклеотидные банки данных.
Задание 1. NCBI Genome
Большая синица (Parus major) - самая крупная синица, достигающая 14 см (рис. 1) [1]. Другое её название - синица-кузнечик (устар.), потому что пение большой синицы можно сравить с мерными ударами молота по наковальне.
Большая синица имеет наибольший ареал среди синиц и множество подвидов. Например, в южном Средиземноморье можно найти несколько подвидов с мощными клювами и коготками, образованные предковой формой, тесно связанной с буковыми лесами. В Англии и Ирландии есть особый английский подвид, в других районах Европы и в Европейской части России так называемый северный подвид, с отступлением ледником распространившийся в Сибирь [3].
Людовик Баварский учреждал «большой штраф для любого, кто осмелится убить синицу — самого усердного истребителя насекомых» (приказ 1328 года) [6].
Для синицы-кузнечика известна одна сборка генома (см. Таблицу 1).
Таблица 1. Информация о сборке. Ссылка на публикацию: Evolutionary signals of selection on cognition from the great tit genome and methylome. Ссылки на bioproject: PRJNA312399 , PRJNA208335Название (assembly name); | Parus_major1.1 |
AC сборки из RefSeq | GCF_001522545.3 |
AC сборки из GenBank | GCA_001522545.3 |
"уровень" сборки (assembly level) | Chromosome |
общая длина последовательности | 1,020,310,769 |
число контигов | 24,044 |
N50 и L50 для контигов | 148,693 и 1,868 |
число скэффолдов | 1,675 |
N50 и L50 для скэффолдов | 71,365,269 и 5 |
число аннотированных белков | 39666 |
Была скачана последовательность одного из контигов в формате .fasta .
Задание 2. NCBI Nucleotide
Fuselloviridae - семейство вирусов с оболочкой лимоновидной формы, естественными хозяевами которых служат археи рода Sulfolobus, живущие в вулканических источниках.
В NCBI , выбрав базу Nucleotide, мы искали геномы вирусов семейства Fuselloviridae, длиной 10000-20000. Текст запроса: ((Fuselloviridae[Organism]) AND 10000:20000[Sequence Length]) AND "Complete Genome" . В Genbank было 45 находок, в Refseq 9 (это указано в левой панели страницы под заголовком Source databases). Выбран Sulfolobus spindle-shaped virus 5.
При нажатии на ссылку в списке находок открывается страница, некоторая страница с которой приведена в Таблице 2 (см. Таблицу 2).
Рядом с заголовком справа есть строчка "Send to", при нажатии на которую открывается окошко, в котором можно поставить точку на "Coding Sequences" и выбрать формат FASTA Nucleotide, далее нажать Create File. Тогда мы скачаем файл с участками генома, предположительно кодирующими белки (CDS). Он скачивается как .txt, потом можно придать ему .fasta.
Таблица 2. Информация о нуклеотидной записи.AC нуклеотидной записи (ACCESSION) | EU030939 |
латинское название вида (SOURCE – ORGANISM) | Sulfolobus spindle-shaped virus 5 |
TaxID вида (FEATURES – source - /db_xref) | 459291 |
тип генома | dsDNA, кольцевая |
Задание 3. NCBI Nucleotide
Информация взята из документа с сайта INSDC .
Таблица 3. Некоторые ключи таблицы особенностей.Feature Key | Definition | |
source | Описание источника определённого промежутка последовательности. Может быть несколько sources. |
source 1..16565 /organism="Homo sapiens neanderthalensis" /organelle="mitochondrion" /mol_type="genomic DNA" /sub_species="neanderthalensis" /db_xref="taxon:63221" /tissue_type="bone fossil" /country="Croatia" /common="Neandertal"[5] |
repeat_region | Последовательность, содержащая повторяющиеся участки. |
repeat_region 1375..1408 /rpt_family="(GAAA)n"[4] |
misc_feature | Последовательность, представляющая биологический интерес, но не характеризуемая имеющимися ключами. Её особенности уточняются после /note=. |
misc_feature 1..402 /note="similar to Homo sapiens EST BE466169 (NID:g9511944) hz60c06.x1"[4] |
gene | Участок, достоверно идентифицированный как ген. |
gene 573..643 /gene="trnF" /db_xref="GeneID:6775088"[5] |
CDS | Последовательность, кодирующая белок. |
CDS 4465..5506 /gene="ND2" /note="TAA stop codon is completed by the addition of 3' A residues to the mRNA" /codon_start=1 /transl_except=(pos:5506,aa:TERM) /transl_table=2 /product="NADH dehydrogenase subunit 2" /protein_id="YP_002124303.1" /db_xref="GeneID:6775094" /translation="MNPLAQPVIYSTIFAGTLITALSSHWFFTWVGLEMNMLAFIPVL TKKMNPRSTEAAIKYFLTQATASMILLMAILFNNMLSGQWTMTNTTNQYSSLMIMMAM AMKLGMAPFHFWVPEVTQGTPLTSGLLLLTWQKLAPISIMYQISPSLNVSLLLTLSIL SIMAGSWGGLNQTQLRKILAYSSITHMGWMMAVLPYNPNMTILNLTIYIILTTTAFLL LNLNSSTTTLLLSRTWNKLTWLTPLIPSTLLSLGGLPPLTGFLPKWAIIEEFTKNNSL IIPTIMATITLLNLYFYLRLIYSTSITLLPMSNNVKMKWQFEHTKPTPFLPTLITLTT LLLPISPFMLMVL"[5] |
tRNA | Последовательность длиной 75-85 нуклеотидов, кодирующая зрелую транспортную РНК. |
tRNA 573..643 /gene="trnF" /product="tRNA-Phe" /db_xref="GeneID:6775088"[5] |
rRNA | Последовательность, кодирующая рибосомальную РНК. |
rRNA 644..1597 /gene="12S rRNA" /product="12S ribosomal RNA" /db_xref="GeneID:6775087"[5] |
D-loop | Displacement loop - область митохондриальной ДНК, с одной из цепей которой может взаимодействовать участок РНК, вытесняя другую цепь. |
D-loop complement(join(1..572,16019..16565))[5] |
Источники:
1. http://ecosystema.ru/08nature/birds/171.php
2. https://ru.wikipedia.org/wiki/%D0%91%D0%BE%D0%BB%D1%8C%D1%88%D0%B0%D1%8F_%D1%81%D0%B8%D0%BD%D0%B8%D1%86%D0%B0
3. http://ornithology.su/books/item/f00/s00/z0000052/st063.shtml
4. https://www.ncbi.nlm.nih.gov/nuccore/AC073210.8
5. https://www.ncbi.nlm.nih.gov/nuccore/NC_011137.1
6. http://obshe.net/posts/id1248.html