Страница студента-первокурсника ФББ
Здравствуйте и добро пожаловать на мою страницу! Я студент 1-ого курса факультета биоинженерии и биоинформатики, Кучевский Максим Владимирович. Раньше жил в городе-курорте Ессентуки Кавказских Минеральных Вод. Обучался в МБОУ СОШ №9, окончил 11 классов с отличием и переехал в Москву.
Практикум 7.
4257 gene
4097 CDS
124 tRNA
4 ncRNA
31 rRNA
1 tmRNA
Kuchevskiy_genome https://docs.google.com/spreadsheets/d/1YqaJkSLWaBtemeabfopHzjbCFXDRHh5Bl3ic_M8wLQg/edit#gid=501545969
=||=
Kuchevskiy_periodic_table https://docs.google.com/spreadsheets/d/1poJQxSUX_E7GvBpvCy2GIBJTJ-KtLqqoE_vgQ7exZ3c/edit#gid=0
=||=
Kuchevskiy_minireview
Мини обзор
Google Диск
https://drive.google.com/file/d/17D07KZE7MvIEcluoj7YSuE2FgqZUTCE6/view?usp=drive_link
Сопроводительный материал
Google Диск
Практикум 12
—
Все коды:
https://colab.research.google.com/drive/1rHFNMlmbieXeCGJLodTI46wacwFikLpx#scrollTo=ToJ317nuf6bX
Задание 1
—
E. coli str. K-12 substr. MG1655:
—
1. ATG 3890 – норма.
2. ATT 4 – этот кодон отличается наиболее частно встречаемого ATG лишь третьим нуклеотидом - возможно, в этих генах (или генах, от которых они происходят) произошла мутация, в результате которой G заменился на T. Каких-либо отличительных особенностей у последовательности с таким старт-кодоном не было замечено.
3. CTG 2 – возможное происхождение от ATG - A-C замещение. Отличительных особенностей у последовательностей не отмечено.
4. GTG 338 – возможное происхождение от ATG - A-G замещение. По каким-то причинам встречается гораздо чаще, чем ATT, CTG, TTG, хотя также, как и эти старт-кодоны отличаются от ATG на один нуклеотид.
5. TTC 1 - короткая последовательность с таким кодоном в начале является псевдогеном (pseudo=true).
6. TTG 80 – возможное происхождение от ATG - A-T замещение. Относительно часто встречается (но реже, чем GTG). С чем связана частота неATG-старт-кодонов неизвестно. Возможные варианты: и A, и G являются пуриновыми основаниями (т. е. могут обладать какими-либо похожими свойствами), встреченными (как первые нуклеотиды в старт-кодонах ATG и GTG) 3890 и 338 раз соответственно, T комплементарен A =>(?) встречается TTG много чаще чем CTG. Цитозин и аденин не являются комплементарными и принадлежат разным группам азотистых оснований =>(?) CTG встречен лишь дважды.
—
Candidatus Gracilibacteria bacterium 28_42_T64:
—
1. ACA 1 - последовательность является коротким псевдогеном.
2. ATG 1129 - норма.
3. GTG 41 - как у E. coli относительно часто встречается. Возможно, из-за каких-то общих черт с ATG в следствие незначительного отличия - на один нуклеотид.
4. TCA 1 - последовательность является коротким псевдогеном.
5. TCT 1 - последовательность является коротким псевдогеном.
6. TTG 23 - как у E. coli относительно часто встречается. Возможно, из-за каких-то общих черт с ATG в следствие незначительного отличия - на один нуклеотид.
—
Mycoplasma pneumoniae M29:
—
1. AAA 1 - псевдоген.
2. ACT 1 - псевдоген.
3. ATA 4 - 3 из 4 - псевдогены.
4. ATC 1 - отличен от ATG на один последний нуклеотид.
5. ATG 629 - норма.
6. ATT 8 - 1 из 8 - псевдоген.
7. CAA 2 - псевдогены.
8. CTC 2 - псевдогены.
9. CTG 1 - отличен от ATG на первый нуклеотид
10. GAA 1 - псевдоген.
11. GGA 1 - псевдоген.
12. GTG 60 - относительная норма - GTG в роли старт-кодона уже встречался в значимых количествах в других бактериях.
13. GTT 1 - псевдоген.
14. TCT 1 - псевдоген.
15. TTA 3 - 2 из 3 - псевдогены
16. TTG 53 - относительная норма - TTG в роли старт-кодона уже встречался в значимых количествах в других бактериях.
—
Общие тенденции:
ATG - главный старт-кодон, GTG и TTG - достаточно широко распространённые старт-кодоны, другие кодоны встречаются в единичных экземплярах и начинают (как правило) псевдогены.
Задание 2
—
Полученные последовательности для E. coli str. K-12 substr. MG1655:
1) lcl|U00096.3_cds_b4587_250 ... [pseudo=true] ... - псевдоген с 4 стоп-кодонами.
2) lcl|U00096.3_cds_AAD13438.1_1459 ...[protein=formate dehydrogenase N subunit alpha][transl_except=(pos:586..588,aa:Sec)] ... [location=1547401..1550448] ... - такая отметка есть только у этой последовательности и двух ниже в данном геноме. [transl_except=(pos:586..588,aa:Sec)] - исключение трансляции в позиции [586;588] (которая соответствует стоп-кодону). Эта позиция находится довольно далеко от конца гена и, скорее всего, игнорируется в результате трансляции.
3) lcl|U00096.3_cds_AAD13456.1_3824 ... [protein=formate dehydrogenase O subunit alpha][transl_except=(pos:586..588,aa:Sec)] ... [location=complement(4082772..4085822)] ... - аналогично предыдущей последовательности 2). Любопытно, что последовательности 2) и 3) очень похожи друг на друга (это видно), длины отличаются лишь на три нуклеотида, а позиции стоп-кодонов совпадают.
4) lcl|U00096.3_cds_AAD13462.1_3997 ... [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] ... - как и в двух последовательностях выше, у этой в оглавлении есть запись об исключении трансляции стоп-кодона по середине. Интересно, что все три последние последовательности кодируют дегидрогеназы.
Задание 3:
—
E. coli str. K-12 substr. MG1655:
TGA 1246
TAA 2761
TAG 306
ATA 1 - псевдоген
GAA 1 - псевдоген (далее ПГ)
—
Candidatus Gracilibacteria bacterium 28_42_T64:
TAA 1000
TAG 188
TCT 2 - ПГ
TTA 1 - ПГ
AAA 1 - ПГ
CTT 1 - ПГ
ACA 1 - ПГ
TGA 1 - ПГ
GAA 1 - ПГ
TGA 0 - ?
—
Mycoplasma pneumoniae M29:
TAG 221 - норма
TAA 533 - норма
ACT 1
ATA 1
GGG 4
AAT 1
CCC 1
GGT 1
GAT 1
TAT 1
ATT 1
TAC 1
AAA 1
TTA 1 - все ПГ
TGA 0 - ?
—
Почему нет TGA стоп-кодонов у двух последних бактерий?
Было замечено, что у бактерий Gracilibacteria кодон UGA в иРНК преимущественно кодирует глицин[1], а у Mycoplasma pneumoniae - триптофан[2]. UGA комплементарен ACT, а ACT - TGA. Таким образом TGA в рассматриваемых последовательностях является кодирующим (глицин или триптофан) кодоном, а не стоп-кодоном.
[1] - Recoding of the stop codon UGA to glycine by a BD1-5/SN-2 bacterium and niche partitioning between Alpha- and Gammaproteobacteria in a tidal sediment microbial community naturally selected in a laboratory chemostat. PMCID: PMC4032931. PMID: 24904545 Anna Hanke, Emmo Hamann, Ritin Sharma, Jeanine S. Geelhoed, Theresa Hargesheimer, Beate Kraft, Volker Meyer, Sabine Lenk, Harald Osmers, Rong Wu, Kofi Makinwa, Robert L. Hettich, Jillian F. Banfield, Halina E. Tegetmeyer, and Marc Strous
[2] - Mycoplasma pneumoniae and Its Role as a Human Pathogen. PMCID: PMC523564. PMID: 15489344 Ken B. Waites, and Deborah F. Talkington
Задание 4:
—
E. coli str. K-12 substr. MG1655:
CTG 71292
TTA 18497
TTG 18295
CTC 14951
CTT 14726
CTA 5203
–
CTG - максимум
CTA - минимум
—
Candidatus Gracilibacteria bacterium 28_42_T64:
TTA 14758
CTT 9330
CTC 3968
CTA 3357
TTG 3236
CTG 1713
–
TTA - максимум
CTG - минимум
—
Mycoplasma pneumoniae M29:
TTA 10307
TTG 5572
CTC 3139
CTA 2852
CTT 2788
CTG 2474
–
TTA - максимум
CTG - минимум
—
Candidatus Gracilibacteria и Mycoplasma pneumoniae имеют одинаковые часто и редко встречаемые кодоны ТТА и CTG соответственно. У Escherichia coli наоборот, CTG чаще встречается, чем другие кодоны, а СТА - реже.
Задание 5:
—
cumulative GC-skew Escherichia coli str. K-12 substr. MG1655
минимум -28,328 позиция 3.870.000 - середина гена
- 3869377..3870441 /gene="cbrA" /locus_tag="b3690" /gene_synonym="ECK3682" /gene_synonym="yidS"
/db_xref="ASAP:ABE-0012068" /db_xref="ECOCYC:EG11714"
максимум 47,733 позиция 1.513.000 - середина гена
- 1512817..1513830 /gene="ydcT" /locus_tag="b1441" /gene_synonym="ECK1435"
/db_xref="ASAP:ABE-0004805" /db_xref="ECOCYC:G6752"
—
https://colab.research.google.com/drive/1nD-Oz7u2lj8u4jfBvGsTUMgTlt38dw8W