Практикум 7

Нуклеотидные банки данных

Задание 1

Для это практикума я выбрал геном Anopheles gambiae, самого известного и самого опасного из видов малярийных комаров (рис. 1).

AN_GAMBIAE
Рис. 1. Anopheles gambiae s. l. на стене в аэропорту Сенуко, Зимбабве. Фотография с сайта inaturalist.org

Комары рода Anopheles, как и большинство комаров вообще, имеют две пары аутосом, обозначаемых 2 и 3, и пару половых хромосом, X и Y (Coluzzi et al., 2002, см. введение). Во многих тканях у них, как и других Diptera, формируются политенные хромосомы. Хромосома X, так как она неспарена, образует одно политенное плечо, обозначаемое также X, а каждая из аутосом образует по два плеча, правое и левое. Всего получается пять различных плеч: X, 2R, 2L, 3R и 3L. Так как узор полос на политенных хромосомах (в частности, в слюнных железах) имеет определяющие значение в систематике комплекса видов Anopheles gambiae s. l., а на препаратах два плеча одной хромосомы выглядят как два отдельных объекта, а иногда могут и вообще отрываться одно от другого, чаще всего в статьях оперируют именно этими "плечами", а не целыми хромосомами (напр., Wondji et al., 2005; George et al., 2010). Более того, в референсной сборке генома Anopheles gambiae плечи аутосом лежат в виде отдельных последовательностей. На рис. 2 показан узор полос на политенных хромосомах, а сверху написаны примерные координаты в геноме.

ARMS_BANDS
Рис. 2. Узор полос на плечах политенных хромосом Anopheles gambiae. Над картами хромосом написаны координаты в геноме. Для аутосом справа находятся теломерные концы (с расширениями), а слева — центромерные. Из George et al., 2010

Про хромосому Y в статьях, посвященных узорам полос, просто не упоминают. В статье о сборке генома сказано, что они секвенировали также и ее, но она состоит большей частью из транспозонов, поэтому собрать ее не удалось, и ее последовательность находится в скаффолдах, которые не удалось локализовать (Holt et al., 2002).

Чтобы найти геном, искал "Anopheles gambiae[Organism]" в базе Assembly. По запросу нашлось пять находок, из них две, включая референсную, уровня сборки "Chromosome". Кстати, во втором геноме с таким уровнем сборки аутосомы не разделены на плечи, а даны в виде целых последовательностей. Такой уровень сборки означает, что удалось получить последовательность хотя бы одной хромосомы, но в ней могут оставаться гэпы, а также в сборке могут присутствовать скаффолды, которые не удалось локализовать на хромосоме. В данном случае, удалось получить последовательности всех хромосом, кроме Y, и в сборке присутствует 8029 неразмещенных скаффолдов. Выбранный геном — рефренсный, что означает, что это качественная сборка, которую выбрали вручную как стандартную для этого вида.

Задание 2

Идентифакторы, размер и характеристики N50 и L50 для контигов и скаффолдов для выбранной сборки приведены в табл. 1. N50 — это длина элемента, такая, что половина всех букв сборки находится в элементах такой и большей длины. L50 — это минимальное количество элементов, в котором содержится половина всех букв сборки.

Табл. 1. Некоторые характеристики выбранной сборки генома
Идентефикатор GenBank GCA_000005575.1
Идентефикатор RefSeq GCF_000005575.2
Общий размер генома 265 Mb
Contig N50 85,5 kb
Contig L50 696
Scaffold N50 12,3 Mb
Scaffold L50 9

Список литературы

  1. Coluzzi, M., Sabatini, A., della Torre, A., Di Deco, M.A. and Petrarca, V., 2002. A polytene chromosome analysis of the Anopheles gambiae species complex. Science, 298(5597), pp.1415-1418.
  2. George, P., Sharakhova, M.V. and Sharakhov, I.V., 2010. High‐resolution cytogenetic map for the African malaria vector Anopheles gambiae. Insect molecular biology, 19(5), pp.675-682.
  3. Holt, R.A., Subramanian, G.M., Halpern, A., Sutton, G.G., Charlab, R., Nusskern, D.R., Wincker, P., Clark, A.G., Ribeiro, J.C., Wides, R. and Salzberg, S.L., 2002. The genome sequence of the malaria mosquito Anopheles gambiae. science, 298(5591), pp.129-149.
  4. Wondji, C., Simard, F., Petrarca, V., Etang, J., Santolamazza, F., Torre, A.D. and Fontenille, D., 2005. Species and populations of the Anopheles gambiae complex in Cameroon with special emphasis on chromosomal and molecular forms of Anopheles gambiae ss. Journal of medical entomology, 42(6), pp.998-1005.