Нуклеотидные банки последовательностей

Целью этой работы было научиться пользоваться банками нуклеотидных последовательностей.

Характеристика качества сборки генома эукариотического организма

Выбранный мной организм - Утконос (лат. Ornithorhynchus anatinus). Это водоплавающее млекопитающее отряда однорпроходных, обитающее в Австралии. Несколько удивительных фактов об утконосах:
Поиск информации о сборке генома утконоса производился базу данных Genome на сайте NCBI. Найдено две сборки генома. Для сборки GCF_000000135.1 ниже представлены некоторые характеристики.
Общаяя длина 1,995,607,322
Число контигов 443,981
Число скэффолдов 200,283
N50 (скэффолд) 958,970
L50 (скэффолд) 309
N50 (контиг) 11,554
L50 (контиг) 39,543
Число аннотированных белков 24786
Ссылка на описание проекта PRJNA12885
Одна из последовательностей контигов (RefSeq) AAPN01000002.1

Описание ключей, используемых в таблицах особенностей

Информация о ключах была найдена здесь
Название ключа Описание ключа Пример Ссылка на запись
1 assembly_gap Границы разрыва между участками генома или транскриптома.
 assembly_gap    1989..2140
                     /estimated_length=152 
                     /gap_type="within scaffold"
                     /linkage_evidence="paired-ends"
ссылка
2 STS Помеченный участок последовательности (sequence-tagged site). Характеризует определенный участок в геноме, для которого известно положение и точная последовательность нуклеотидов. Он может быть выявлен с помощью ПЦР.
 STS             2317..2510
                     /standard_name="RH136367"
                     /db_xref="UniSTS:210357"
ссылка
3 misc_feature Место в последовательности, которое представляет интерес для изучения, но другие ключи для описания не подходят. Новая или редкая черта последовательности.
 misc_feature    2719..2806
                    
ссылка
4 D-loop Петля смещения. Участок внутри митохондриальной ДНК, в котором РНК связана с одной цепью ДНК, вытесняя оригинальную вторую цепочку ДНК. Также используется для описания вытеснения одной цепочки ДНК из дуплекса одноцепочной вставкой, реакция катализируется RecA белком.
 D-loop          15736..16916
ссылка
5 ncRNA Обозначает участок гена, кодирющий не белок, не транспортную РНК и не рибосомальную РНК. Участок кодирует какую-то РНК.
 ncRNA           join(21952..22941,22998..24237)
			/ncRNA_class="antisense_RNA" 
			/gene="CR43609"    
			/locus_tag="Dmel_CR43609" 
			/gene_synonym="Dmel\CR43609" 
			/product="CR43609"          
			/note="CR43609-RA; Dmel\CR43609-RA" 
			/transcript_id="NR_047865.1"        
			/db_xref="FLYBASE:FBtr0309810"      
			/db_xref="GeneID:12797867"          
			/db_xref="FLYBASE:FBgn0263584"
ссылка
6 regulatory Любой участок последовательности, который участвует в регуляции трансляции, транскрипции репликации или chromatin structure.
 regulatory      323075..323919
                     /standard_name="PTPRC intron CAGE-defined mid-level     
                      expression enhancer"                                    
                     /note="Region: biological region; Derived by automated  
                      computational analysis using gene prediction method:    
                      Curated Genomic."                                       
                     /db_xref="GeneID:108281163"                             
ссылка
7 exon Участок генома, который кодирует части РНК, остающиеся после сплайсинга.
 exon            141797..142149
                     /gene="LOC100288016"
                     /note="Derived by automated computational analysis using
                      gene prediction method: Curated Genomic."
                     /pseudo
ссылка

Описание массового геномного проекта

Проект генома пчелы (Honey Bee Genome Project) был начат в 2002 году американскими учеными. На данный момент анализ данных в 20 лабораториях завершен. В 2011 году была выпущена последняя версия генома Apis mellifera (honey bee) - медовая пчела. Почему важно изучить геном пчелы? Пчелы - важный элемент жизненного цикла растений, благодаря им происходит опыление растений и их дальнейшее развитие. Так же на пчелах можно изучать механизмы разных заболеваний, связанных с человеком, так как у пчел есть некоторые важные гены, схожие с генами млекопитающих. А еще ученым было интересна социальная организация пчел и поведенческие черты. В итоговой последовательности около 10000 генов и 236 миллионов пар оснований. Проект спонисировался National Human Genome Research Institute (NIH) и United States Department of Agriculture (USDA).
Несколько ссылок о проекте:

National human genome institute

Baylor college of medicine

Таблица митохондриальных генов

Был взят орагнизм Вельвичия удивительная (лат. Welwitschia mirabilis). AC: KT313400
Поиск производился по ENA на сайте EBI.
Текст запроса: tax_tree(1437180) AND mol_type="genomic DNA" AND topology="CIRCULAR" AND organelle="mitochondrion"

Количество находок в Release - 3, в Update - 1.

Ссылка на таблицу митохондриальных генов Вельвичии удивительной.

Было найдено 29 белковых записей (поле CDS).

© Нестеренко Екатерина 2018