Главная | Семестры | Третий семестр |
В качестве объекта я выбрал Беркута (Aquila chrysaetos). Беркут - спецподразделение МВД Украины крупная птица из семейства ястребиных. Распространена преимущественно в горных районах Северного
полушария. Хищная птица, питающаяся в основном грызунами, падалью, другими птицами. Вид в настоящее время находится под угрозой и охраняется.
В сборке с более высоким уровнем часть контигов из старой версии не была доступна (запись не найдена),
а в общая длина новой составляет 1% заявленной. Из 4 сборок я выбрал одну с наибольшим покрытием и всеми доступными контигами в WGS.
Ее характеристики:
Название: Aquila_chrysaetos-1.0.2
AC RefSeq: GCF_000766835.1
Assembly level: Scaffold
Длина, МБ: 1193
Число скэффолдов: 1142
Скэффолд N50: 9230743
Скэффолд L50: 40
Число контигов: 17032
Контиг N50: 172329
Контиг L50: 2004
Аннотированные белки: 31284
Проект (PubMed)
Один из контигов
Последовательности контигов я нашел следующим образом: перешел из записи Assemble по ссылке в поле WGS Project:, перешел по ссылке в строке WGS, в таблице с контигами поле View -> Fasta, далее Send to -> File -> FASTA.
Рисунок 1. Беркут .
В этом задании я искал полные геномы вирусов семейства Microviridae длины 4000-5000 пар нуклеотидов. Поиск в NCBI по Nucleotide. Запрос ((Microviridae[Organism]) AND 4000:5000[Sequence Length]) AND "complete genome" . Кавычки для поиска по такой строке. Найдено 1303 записи, из них 1276 в INSDC и 27 в RefSeq. Я выбрал эту запись, привел для нее некоторые характеристики (Таблица 1) и скачал файл с последовательностями, предположительно кодирующими белки. Файл получил следующим путем: открытая запись -> Sent to -> Coding sequences -> FASTA Nucleotide.
AC | NC_007461 |
Название | Chlamydia phage 4 |
TaxID | 313629 |
Тип генома | circular single-stranded (статья) |
Хозяин вируса | Chlamydophila abortus (статья) |
Таблица 1. О вирусе.
Для расшифровки ключей я использовал данный мануал.
Feature | Описание | Пример |
misc_feature | Участок интереса, которыq не удается определить как любой другой. |
misc_feature 135663^135664 /locus_tag="RB276" /note="cosmid pircos-c1d12/ cosmid pircos-d2e11 joining point" |
gene | Участок интереса, в котором предположительно находится ген. |
gene 7137091..7137201 /locus_tag="RB13311" /db_xref="GeneID:1794243" |
CDS | Кодирующая последовательность; последовательность нуклеотидов, соответсвующая последовательнсоти аминокислот, учитывая стоп-кодон и генетический код. |
CDS 7137091..7137201 /locus_tag="RB13311" /codon_start=1 /transl_table=11 /product="hypothetical protein" /protein_id="NP_870974.1" /db_xref="GeneID:1794243" /translation="MWKCIKKPRPRIADEVSIVDESVRRLALRARSQRLL" |
regulatory | Любой участок, отвечающий за регуляцию (напр. транскрипции, трансляции, репликации). |
regulatory 44389064..44390365 /regulatory_class="enhancer" /experiment="EXISTENCE:transgenic organism evidence [ECO:0001131][PMID:17130149]" /note="VISTA enhancer hs516" /function="enhancer in: limb[4/6]" /db_xref="GeneID:110120690" /db_xref="VISTA:hs516" |
protein_bind | Сайт нековалентного связывания белка на нуклеиновой кислоте. |
protein_bind 44385774..44385801 /experiment="EXISTENCE:protein binding evidence [ECO:0000024][PMID:22303449]" /note="ISL1 site" /bound_moiety="ISL LIM homeobox 1" /db_xref="GeneID:109194135" |
assembly_gap | Разрыв между двумя структурами в геномной/транскриптомной сборке. |
assembly_gap 49721204..49721303 /estimated_length=100 /gap_type="between scaffolds" |
rep_origin | Участок начала репликации молекулы. |
rep_origin 132079845..132079954 /experiment="EXISTENCE:fractionation evidence [ECO:0000100][PMID:16109380]" /note="GM-CSF Ori1 (primer set 17; PMID:16109380); peak of nascent strand synthesis determined by competitive PCR of size-fractionated nascent DNA" /direction=BOTH /db_xref="GeneID:107198087" |
Таблица 2.