Отчет по практикуму 7. Банки нуклеотидных последовательностей.

На этой странице выложен отчет по практикуму 7.

Задание 1.

Для выполнения задания 1 была выбрана гидра обыкновенная (Hydra vuldaris)— небольшой представитель пресноводных гидроидных.

Систематика:
Домен: Эукариоты
Царство: Животные
Подцарство: Эуметазои
Тип: Стрекающие
Подтип: Medusozoa
Класс: Гидроидные
Подкласс: Hydroidolina
Отряд: Anthoathecata
Семейство: Hydridae
Род: Гидры
Вид: Гидра обыкновенная

Гидры обыкновенные имеют от 4 до 12 щупалец, которые выступают из района ткани около рта. Гидры — хищники. Они питаются таким образом: их щупальца расширяются, и они ожидают добычу. Когда потенциальная добыча подплывает к месту нахождения гидры, гидра прикасается к добыче щупальцами. Добыча поражается стрекательными клетками гидры. Затем гидра поглощает и переваривает добычу. Все, что не может быть переварено, выходит через то же ротовое отверстие. Как и другие гидры, гидра обыкновенная цепляется за базовый объект так называемой «подошвой». Чтобы передвинуться, иногда гидра изменяет положение тела, присоединяется щупальцами к другому месту базового объекта, затем отсоединяет подошву и прикрепляет к ещё одному месту базового объекта, а затем становится в своё обыкновенное положение. Гидра обыкновенная, как и другие гидры, часто используется как модельный организм, потому что за ними легко ухаживать, они требуют минимальной прямой помощи, и воспроизводятся гидры относительно быстро. Кроме того, гидры не подвержены старению. Это делает их биологически бессмертными. Они не умирают от старости, но умирают от болезней или в случае, если их съедают. Воспроизведение гидры обыкновенной может произойти по трем направлениям — бесполое размножение, половое размножение и регенерация. Бесполое размножение гидры обыкновенной происходит при благоприятных условиях. На стенке тела гидры образуются выпячивания. Это — новые особи гидр. Они постепенно развиваются, затем отделяются от материнской особи гидры и живут самостоятельно. Гидры используют этот вид размножения чаще, потому что это куда проще, а в результате особей гидр создается больше. Половое размножение же происходит во время неблагоприятных для гидры обыкновенной условиях, например, осенью. На телах гидр образуются пупырышки. В них созревают мужские (сперматозоиды) и женские (яйцеклетки) половые клетки. Среди гидр есть гермафродиты и есть раздельнополые. Вид гидра обыкновенная — гермафродит, и в её теле созревают оба вида половых клеток. Затем сперматозоиды выходят в воду и оплодотворяют яйцеклетки. Вокруг оплодотворенной яйцеклетки образуется защитная оболочка, благодаря которой зародыш защитится от неблагоприятных условий. Затем оплодотворенные яйцеклетки делятся. При наступлении благоприятных условий новая особь гидры обыкновенной выходит из оболочки. Третий вид размножения — регенерация. Благодаря промежуточным клеткам каждая часть тела, если в ней есть хотя бы одна промежуточная клетка, может образовать новую гидру.

Таблица 1. Отчет по заданию 1
Число сборок генома 2
Число проектов по секвенированию 1
Число образцов по секвенированию 2
Характеристика сборки GCF_000219015.2
Описание образца(BioSample ID: SAMN00000081) Организм:Hydra vulgaris
Taxonomy ID: 6087
Систематика:Eukaryota; Metazoa; Cnidaria; Hydrozoa; Hydroidolina; Anthoathecata; Aplanulata; Hydridae; Hydra; Hydra vulgaris2
Описание проекта (BioProject ID: PRJNA12876) Геномные скэффолды представлены контигами H379587-CH396048. Проект Геном Гидры является совместным проектом JCVI, JGI, лаборатории Дэна Рохсэра в университете Беркли и лаборатории Роба Стила в университете Ирвин. Упорядочивание и начальная сборка были сделаны JCVI и отправлены в GenBank как WGS-проект ABRM00000000. Та сборка часто представляла собой два гаплотипа Гидры в отдельных контигах/скэффолдах. Вторая сборка была сделана в JGI и является сборкой гаплоидного типа, где каждый локус, как ожидается, будет представлен только один раз. Эта сборка является WGS-проектом ACZU00000000.
Контиги* Общее число: 236,667
***N50: 12,864
****L50: 24,701
самый длинный контиг ctg1101284780624, длина 192,195
самый короткий контиг ctg1101284616801, длина 66
таблица доступна по ссылке
Скэффолды** Общее число: 132,858
N50: 64,586
L50: 5,241


*Контиг – секвенированный без пропусков фрагмент ДНК;
**Cкэффолд – набор контигов, про который доказано, что контиги в ДНК идут по одной цепи строго друг за другом;
***как найти N50: упорядочим контиги по длине по убыванию, найдем первый контиг такой, что он и все более длинные покрывают более половины генома, длина этого контига и есть N50;
****как найти L50: посчитаем, сколько контигов покрывает половину генома; это и есть L50.

Задание 2. В этом задании было необходимо описать десять ключей, используемых в таблицах особенностей (Feature Key или Feature table). Результаты задания приведены в таблице 2.

Таблица 2. Некоторые Feature Keys
Название Описание Пример
D_segment Разнообразные сегменты тяжелых цепей иммуноглобулинов и бета-цепи рецепторов T-клеток
D_segment       339..349 				                                                                                      
		/gene="IGH@"
                /note="DH2-15"                                                                                                                        
			
C_region Постоянные регионы легких и тяжелых цепей иммуноглобулинов; альфа, бета и гамма цепи рецепторов T-клеток, включает один или более экзонов в зависимости от конкретной цепи
 C_region  	join(1108940..1109233,1109626..1109676,1109820..1109864,
                1110008..1110052,1110196..1110240,1110359..1110688,
                1110786..1111100,1112402..1112532,1114348..1114431)
	        /gene="IGHG3"
                /gene_synonym="IgG3"
                /standard_name="IGHG3, encoding membrane bound form"
			
intron Сегмент ДНК, который транскрибируется, но удаляется из цепи в рамках сплайсинга, соединяя вместе последовательности (экзоны) по обе стороны от него
intron          224..568       
			
misc_binding Сайт в нуклеиновой кислоте, который ковалентно или нековалентно связывает другую часть, которая не может быть описана другими связывающими ключами(праймер-сязывающими и белок-связывающими)
misc_binding    complement(167347..167449) 		
	        /inference="COORDINATES: nucleotide
                motif:Rfam:12.0:RF00162"
                /inference="COORDINATES: profile:INFERNAL:1.1.1"
                /note="SAM riboswitch class I; Derived by automated
                computational analysis using gene prediction method:
                cmsearch."
                /bound_moiety="S-adenosylmethionine"
                /db_xref="RFAM:RF00162"	                                                                                                                                                                            
			
polyA_site Сайт на РНК транскрипте, в который были добавлены остатки аденина в ходе посттрансляционного полиаденилирования
polyA_site      1128 		
		/gene="POLR2H"
                /gene_synonym="RPABC3; RPB17; RPB8"
                /note="The 3' most polyA site has not been determined.
                This is an internal polyA site."	


                                                                          
                                                                                  
			
precursor_RNA Предшественник РНК. Любая разновидность незрелой РНК. Может включать ncRNA, rRNA, tRNA, 5' нетранслируемые участки (5'UTR), кодируемые последовательности (CDS, exon), кодируемые послдовательности (интроны) и 3' нетранслируемые участки (3'UTR);
precursor_RNA   1..65 		
		/gene="mir-5595"
                /locus_tag="CELE_F26H11.7"
                /product="pre-microRNA mir-5595"
                /note="F26H11.7"
                /db_xref="GeneID:13187948"                                                                          
                                                                                          
			
repeat_region область генома, содержащая повторяющиеся участки
repeat_region   1..430 	
		/gene="NAIP"
                /gene_synonym="BIRC1; NLRB1; psiNAIP"
                /note="long terminal repeat (LTR)"
                /rpt_family="HERV-P"                                                                                                                               
			
rep_origin Ориджин репликации; стартовый сайт для дупликации нуклеиновых кислот для получения 2 идентичных копий
rep_origin      1..442 	
		/note="oriV; conserved part of vegetative replication
                origin including interons"                                                                  
                                                                                  
			
N_region дополнительные нуклеотиды, вставленные между перестроенными сегментами иммуноглобулина.
N_region        7..9		                                                                                                                           
			
ncRNA Ген, не кодирующий белок, результатом транскрипции которого является особый тип РНК, отличный от рРНК и тРНК.
ncRNA           1..24	
		/ncRNA_class="miRNA"
                /gene="mir-5595"
                /locus_tag="CELE_F26H11.7"
                /product="microRNA mir-5595,a"
                /standard_name="F26H11.7a"
                /db_xref="GeneID:13187948"                                                                  
                                                                                  
			
Задание 3. В этом задании было необходимо описать состояние дел в одном из массовых геномных проектов. Ниже представлена информация о выбранном проекте.



Задание 4. В этом задании необходимо было составить таблицу митохондриальных генов одного из организмов указанного таксона. Мне был дан таксон Apusozoa.Сначала нужно было найти полные митохондриальные геномы представителей таксона. Всего было найдено 2 полных митохондриальных генома; из них RefSeq: 0, GenBank: 2.
Для поиска использовался запрос
   
Apusozoa[Organism] AND mitochondrion[Filter] AND complete[Title]
Рис. 1. Электронная фотография Thecamonas trahens
Далее нужно было составить таблицу митохондриальных генов одного из организмов указанного таксона. Для выполнения этого пункта был выбран организм Thecamonas trahens. Систематика:
    Домен:			Eukaryota
    Царство:		        Unikonta
    Тип:			Apusozoa
    Класс:			Thecomonadea
    Порядок:			Apusomonadida
    Семейство: 		        Apusomonadidae
    Род:			Amastigomonas 
    Вид:			Thecamonas trahens

Из записи с выбранной последовательностью генома можно перейти на страницу генов по ссылке gene в разделе Related information. Далее список всех генов был скачан (send to > File) с сортировкой по порядку в геноме (Sort by chromosome) в формате Tabular (text). Скачанный файл был отредактирован в Excel.
Результат можно скачать: table.xlsx.















Задание 5. В этом задании необходимо было заполнить таблицу размеров некоторых геномов из презентации. В качестве размера генома был выбран размер генома представителя (Size (Mb)). В качестве размера типичного генома был выбран размер генома медианного представителя. Для этого все геномы были отсортированы по размеру и выбран геном, длина которого находилась в середине списка. В случае вирусов сравнивались все группы, в том числе бактериофаги, вирусы-сателлиты, вирусы без определенной классификации. В таблице 3 приведены результаты выполнения задания 5.
Таблица 3. Некоторые геномы из презентации
Организм Размер генома (Mb)
Вироиды
Минимальный размер:Coconut cadang-cadang viroid 0.000246
Типичный размер:Coleus blumei viroid 1; Dahlia latent viroid(одинаковый размер генома у 2 организмов)) 0.000342
Максимальный размер:Apple hammerhead viroid-like circular RNA 0.000434
Вирусы, бактериофаги
Минимальный размер:Acartia tonsa copepod circovirus 0.00167
Типичный размер:Acidianus filamentous virus 9 0.041172
Максимальный размер:Acanthamoeba polyphaga mimivirus 1.18155
Бактерии
Минимальный размер:Cloacimonetes bacterium JGI 0000039-I11 0.104827
Типичный размер: Lactobacillus ginsenosidimutans 2.59056
Максимальный размер: Mumia flava 16.3772
Археи
Минимальный размер:Candidatus Parvarchaeum acidophilus2 0.100212
Типичный размер:Candidatus Altiarchaeales archaeon WOR_SM1_86-2 2.08797
Максимальный размер:uncultured marine crenarchaeote 'Gulf of Maine' 6.4512
Эукариоты
Минимальный размер:Corbicula fluminea 0.662517
Intoshia linei 41.6031
Типичный размер:Trichinella papuae 46.8445
Octopus bimaculoides 2338.19
Mus spretus(мышь домовая) 2625.59
Homo sapiens(человек разумный) 3238.44
Максимальный размер:Pinus lambertiana(сосна Ламберта) 27602.7


По данным, приведенным в таблице, видно, что отношение максимального размера генома к минимальному больше всего у эукариот (max/min=2456630) и поменьше у вирусов (max/min=11245). Затем идут бактерии (max/min=156) и археи (max/min=64). Наименьшее отношение у вироидов (max/min=1,76), общее число опубликованных геномов которых тоже, однако, не очень велико.