Главная
О себе
Список курсов
Сайт ФББ

Практикум 7. Банки нуклеотидных последовательностей

1. Сборка эукариотического организма

Для выполнения данного задания был выбран Обыкновенный шимпанзе Pan troglodytes, поскольку данный вид приматов близок к человеку. В NCBI Genome нашлось 6 сборок, имеющих отношение к данному виду. Однако лишь первая из них представляет большой интерес, так как в ней описано на 2 порядка больше генов и белков, чем во второй по объёму сборке.

Характеристики сборки

2. Ключи таблицы особенностей [1]

КлючОписаниеПример
CDSКодирующая последовательность.
CDS             405..1934
                /operon="gal"
                /gene="galA"
                /product="galactose permease"
                /function="galactose transporter"
				
mRNAмРНК. Включает 5' и 3'-нетранслирующиеся участки и кодирующие последовательности.
mRNA            join(10..567,789..1320)
                /gene="ubc42"				
				
regulatoryРегуляторный участок генома.
regulatory      <1..9
                /gene="ubc42"
                /regulatory_class="promoter"		
				
exonУчасток генома, который кодирует часть зрелой мРНК.
exon            789..1320
                /gene="ubc42"
                /number=2				
				
operonУчасток генома, состоящий из нескольких генов, который образуе единый транскрипт.
operon          160..6865
                /operon="gal"				
				
intronУчасток генома, который транскрибируется на мРНК, но затем удаляется во время сплайсинга.
intron          568..788
                /gene="ubc42"
                /number=1				
				
repeat_regionПовторяющийся участок генома.
repeat_region   80..401
                /rpt_type=DISPERSED
                /rpt_family="Alu-J"				
				

3. Состояние дел в геномном проекте

4. Таблица митохондриальных генов одного из организмов типа Cnidaria

Был выбран вид Hydra vulgaris (Гидра обыкновенная). Поиск производился в NCBI Nucleotide по запросу:

"Hydra vulgaris"[Organism] AND biomol_genomic[PROP] AND mitochondrion[filter]

Всего было выдано 174 результата. Из них 170 - в GenBank, 2 - в RefSeq. Из RefSeq результатов была выбрана запись "Hydra magnipapillata mitochondrion chromosome 1, complete sequence" с AC: NC_011220.1. Запись была загружена в формате GenBank, затем из нее была получена аннотация в табличном формате .gff командой:

featcopy hydra_mitochondrion.gb -outfeat prots.gff

Полученная таблица была обработана в Excel и приведена к виду, который требовался в задании. Результат: cds.xlsx.

Источники:

  1. http://www.insdc.org/files/feature_table.html