Банки нуклеотидных последовательностей

Задание 1. Качество сборки генома эукариотического организма

В качестве исследуемого организма был выбран Centruroides sculpturatus - Аризонский древесный скорпион. Обитает на юго - западе США и северо - западе Мексики. Врослые самцы достигают до 8 см в длину, самки чуть меньше. Этот скорпион особенно хорошо приспособлен к пустыне: слои воска на его экзоскелете делают его устойчивым к потере воды. Тем не менее, в жаркое время они прячутся од камнями, древесными сваями или древесной корой. Centruroides sculpturatus - самый ядовитый скорпион в Северной Америке, и его яд может вызвать сильную боль (в сочетании с онемением, покалыванием и рвотой) у взрослых людей, обычно длительностью от 24 до 72 часов. Однако смертность от этого членистоногого довольно редка.

Для данного организма присутствовала одна сборка - Cexi_2.0. Общая длина последовательности составила 925,474,958 пар оснований. Число скэффолдов составило 8,338, число контигов - 35,614. N50 - 52,294, L50 - 4,756. Число аннотированных белков - 35529.

Ссылка на публикацию

Ссылка на последовательность контига

Задание 2. Ключи

  1. Ключ 1: C_region

  2. Определение:

    постоянная область легкого и тяжелого иммуноглобулина цепи и рецептор Т-клеток альфа, бета и гамма цепи; включает один или несколько экзонов в зависимости от конкретной цепочки

    Пример:

    https://www.ncbi.nlm.nih.gov/nuccore/EF589524.2

    C_region 322..639

    /allele="IGLC2*02"

  3. Ключ 2: CDS

  4. Определение:

    кодирующая последовательность; последовательность нуклеотидов, которая соответствует последовательности аминокислот белок (местоположение включает стоп-кодон); функция включает в себя концептуальный перевод аминокислот.

    Пример:

    https://www.ncbi.nlm.nih.gov/nuccore/BHXA01000007.1

    CDS 109..525

    /locus_tag="SNL152K_134"

    /note="putative membrane protein"

    /codon_start=1

    /transl_table=11

    /product="hypothetical protein"

    /protein_id="GCB42851.1"

    /translation="MAYNRALRTTAATDQGPLAVYVAHLGSARVNARAGFWTDSRDRAQALGKAIAAEQNERVVLLGDLNGTMDDRAFADITSQLRSAQDAAGDGFGFTWPAKFPVVRIDQILVRGVKPESSWSLPATGSDHLPVAAEISW"

  5. Ключ 3: centromere

  6. Определение:

    регион, идентифицированный как центромера и экспериментально охарактеризованный;

    Пример:

    https://www.ncbi.nlm.nih.gov/nuccore/MG708494.1

    centromere <1..>297

  7. Ключ 4: D-segment

  8. Определение:

    Вариабельный сегмент тяжелой цепи иммуноглобулина и Бета-цепь рецептора Т-клеток;

    Пример:

    https://www.ncbi.nlm.nih.gov/nuccore/NG_006980.1

    D_segment 651369..651382

    /gene="Trbd2"

    /gene_synonym="Gm16803; Tcrb-D2"

    /standard_name="TRBD2"

    /db_xref="GeneID:100125247"

  9. Ключ 5: exon

  10. Определение:

    область генома, которая кодирует часть сплайсированной мРНК, рРНК и тРНК; может содержать 5'UTR, все CDS и 3 UTR;

    Пример:

    https://www.ncbi.nlm.nih.gov/nuccore/NR_159430.1

    exon 314..1355

    /gene="LOC100381888"

    /gene_synonym="GRMZM2G177510"

    /inference="alignment:Splign:2.1.0"

    /pseudo

  11. Ключ 6: gap

  12. Определение:

    разрыв в последовательности

    Пример:

    https://www.ncbi.nlm.nih.gov/nuccore/LQ907673.1

    gap 40..232

    /estimated_length=193

  13. Ключ 7: mobile_element

  14. Определение:

    область генома, содержащая подвижные элементы;

    Пример:

    https://www.ncbi.nlm.nih.gov/nuccore/MK031169.1

    mobile_element 1..330

    /mobile_element_type="SINE:AluYb8"

    Задание 3. Геномный проект

    Для описания был выбран проект Extraordinary Genetic Diversity in a Wood Decay Mushroom. Целью проекта стал сравнительный анализ 24 гаплоидных генотипов (12 из Соединенных Штатов и 12 из Европейской России) грибов рода Schizophyllum. Этот проект был поддержан Министерством образования и науки Российской Федерации (грант № 11.G34.31.0008) и Программой молекулярной и клеточной биологии Российской академии наук. Было отсеквенировано 24 генома. Проект завершён в 2015 году.

    Ссылка на публикацию в PubMed

    Задание 4. Митохондриальные гены

    Поиск производился в базе ENA. Текст запроса: "tax_tree(33634) AND mol_type="genomic DNA" AND topology="CIRCULAR" AND organelle="mitochondrion"". По результатам поиска в Update оказалась всего одна находка, в Release - 164. Был выбран организм Sargassum muticum из царства Stramenopiles.

    AC объекта: KJ938301.1

    Таблица митохондриальных генов


    © Иззи Антон,2018