Нуклеотидные базы данных

Рис. 1. Красный фламинго
Задание 1. Для выполнения задания 1 я выбрала Красного фламинго (Phoenicopterus ruber ruber) — птица из отряда фламингообразных. Оперение у взрослых самцов и самок — нежно-розового цвета, крылья — пурпурно-красные, маховые — чёрные. Розовый фламинго — самый распространённый вид фламинго. Также это единственный вид фламинго, обитающий на территории бывшего Советского Союза, в казахстанских озёрах Тенгиз, Челкартенгиз и Ащитастысор. Розовый фламинго населяет большие озёра с солёной водой, морские лагуны и лиманы. Кормится на мелководье с илистым дном в труднодоступных местах.

Систематика:
  
                        Домен: 		Эукариоты
                        Царство:        	Животные
                        Тип:		Хордовые    
                        Класс:		Птицы
                        Отряд:		Фламинго
                        Семейство:	Фламинговые
                        Род:		Pheonicopterus
                        Вид:		Pheonicopterus ruber ruber	

На сайте NCBI по ссылке Browse by organism на странице базы данных Genome был выбран этот вид. Ниже в табл. 1 представлен небольшой отчет.


Таблица 1. Отчет по заданию 1
Число сборок генома 1
Число проектов по секвенированию 1
Число образцов по секвенированию 1
Характеристика сборки GCA_000687265.1
Описание образца (BioSample ID: SAMN02339890) пол: мужской
sample name: BGI_N337
Описание проекта (BioProject ID: PRJNA212904) Геном Phoenicopterus ruber ruber секвенировали в BGI с использованием метода WGS (дата регистрации: 2014/04/30).Номер доступа к проекту: JRE00000000; данная версия проекта имеет номер доступа: JRE01000000 и состоит из последовательностей JRE01000001-JJRE01137480. Геномные скэффолды представлены контигами KK403368:KK436797.
Контиги общее число: 137 480
N50: 20 262
L50: 16 707
Скэффолды общее число: 76 189
N50: 38 071
L50: 8 592
(т.к. отдельной таблицы нет, данные взяты из общей таблицы; также можно использовать результаты поиска, но в нем вместо 76 189 скэффолдов найдено почему-то только 33 430 (это только те, которые собрались более чем из одного контига)). Ссылка на список АС для всех 76189 скэффолдов.


По данной ссылке вы можете найти последовательность самого длинного контига con42.fasta

Задание 2. В этом задании было необходимо описать десять ключей, используемых в таблицах особенностей (Feature Key или Feature table). Результаты задания приведены в таблице 2.

Таблица 2. Некоторые Feature Keys
Название Описание Пример
STS англ. sequence tagged site — короткая последовательность ДНК, которая может быть определена с помощью ПЦР; карта участка генома может быть построена с помощью определения порядка расположения STS.
 STS		2050089..2050757
		               /standard_name="ha2600"
		               /db_xref="UniSTS:515570"
				
rep_origin англ. rep.origin — Квалификатор /standard_name встречается часто с различными ключами и используется для записи общепринятых стандартных названий. Квалификатор /experiment вкратце отражает суть эксперимента, подтверждающего наличие особенности.
rep_origin		3617..3892
			                /standard_name="ori1"
                /experiment="experimental evidence, no additional 
		details recorded"
                /citation=[2]
                
precursor_RNA англ. precursor RNA — предшественник РНК. Любая разновидность незрелой РНК; может включать нкРНК, рРНК, тРНК, 5'UTR, CDS, экзоны, интроны, 3'UTR.
precursor_RNA	133385..133502
				/gene="mir-4915"
				/locus_tag="Dmel_CR43552"
				/gene_synonym="CR43552"
				/product="mir-4915 precursor RNA"
				/note="mir-4915-RM; Dmel\mir-4915-RM; CR43552-RM;
				Dmel\CR43552-RM"
				/db_xref="miRBase:MI0017697"
misc_RNA Любые транскрипты, которые не подходят под определения других feature keys для РНК (prim_transcript, precursor_RNA, mRNA, 5'UTR, 3'UTR, exon, CDS, sig_peptide, transit_peptide, mat_peptide, intron, polyA_site, ncRNA, rRNA and tRNA)
misc_RNA	join(539636..540073,540849..540956,541819..543839)
			/gene="LOC107971886"
			/product="uncharacterized LOC107971886, transcript variant X3"
			/note="Derived by automated computational analysis using
			gene prediction method: Gnomon. Supporting evidence
			includes similarity to: 1 mRNA, 1 EST, and 75% coverage of
			the annotated genomic feature by RNAseq alignments"
			/transcript_id="XR_001714724.1"
			/db_xref="GeneID:107971886"
				
repeat_region Участки генома, содержащие повторы.
                            repeat_region	22894..23276
			/locus_tag="KLLA0C00308t"
			/old_locus_tag="Klla0C.LTR.2"
			/rpt_type=long_terminal_repeat
				
mobile_element Участки генома, содержащие подвижные элементы.
                                mobile_element	841364..850816
				/note="uniprot|Q9C0U1 Yarrowia lipolytica Ylt1 LTR-
				retrotransposon"
				/mobile_element_type="retrotransposon"
				
old_sequence Приведенная последовательность корректирует предыдущую версию последовательности.
                             old_sequence		4086
				/citation=[3]
				/replace="c"
				
D-loop англ. displacement loop — петля смещения. Область в митохондриальной ДНК, в которой короткая РНК взаимодействует с одной из цепей ДНК, замещая комплементарную цепь ДНК в этой области. Также D-loop описывает замещение участка одной цепи дуплекса ДНК каким-либо другим одноцепочечным фрагментом в реакции, катализируемой белком RecA.
                                  D-loop		15715..16825
			/note="control region"
				
misc_binding Сайт в нуклеиновой кислоте, который ковалентно или нековалентно взаимодействует с другим участком; не может быть описан другими feature key (primer_bind or protein_bind).
                                   misc_binding	111478..111597
			/inference="COORDINATES: nucleotide
			motif:Rfam:12.0:RF00059"
			/inference="COORDINATES: profile:INFERNAL:1.1.1"
			/note="TPP riboswitch; Derived by automated computational
			analysis using gene prediction method: cmsearch."
			/bound_moiety="thiamine pyrophosphate"
			/db_xref="RFAM:RF00059"
				
J_segment Сегмент тяжелой и легкой цепи иммуноглобулина и альфа-, бета- и гамма-цепей Т-клеточного рецептора.
                        J_segment	328..393
			/gene="TCR1A"


Задание 3. В этом задании было необходимо рассказать о каком-нибудь массовом геномном проекте.