Kodomo

Пользователь

Страница студента-первокурсника ФББ

Здравствуйте и добро пожаловать на мою страницу! Я студент 1-ого курса факультета биоинженерии и биоинформатики, Кучевский Максим Владимирович. Раньше жил в городе-курорте Ессентуки Кавказских Минеральных Вод. Обучался в МБОУ СОШ №9, окончил 11 классов с отличием и переехал в Москву.


Практикум 7.

4257 gene

4097 CDS

124 tRNA

4 ncRNA

31 rRNA

1 tmRNA


Kuchevskiy_genome https://docs.google.com/spreadsheets/d/1YqaJkSLWaBtemeabfopHzjbCFXDRHh5Bl3ic_M8wLQg/edit#gid=501545969

=||=

Kuchevskiy_periodic_table https://docs.google.com/spreadsheets/d/1poJQxSUX_E7GvBpvCy2GIBJTJ-KtLqqoE_vgQ7exZ3c/edit#gid=0

=||=

Kuchevskiy_minireview

Мини обзор

Google Диск

https://drive.google.com/file/d/17D07KZE7MvIEcluoj7YSuE2FgqZUTCE6/view?usp=drive_link

Сопроводительный материал

Google Диск

https://docs.google.com/spreadsheets/d/1EIXLIYPUHtUh7kV4-QjxXfXLEa2qVn0KEqQkIVDsP6A/edit?usp=drive_link


Практикум 12

Все коды:

https://colab.research.google.com/drive/1rHFNMlmbieXeCGJLodTI46wacwFikLpx#scrollTo=ToJ317nuf6bX


Задание 1

E. coli str. K-12 substr. MG1655:

1. ATG 3890 – норма.

2. ATT 4 – этот кодон отличается наиболее частно встречаемого ATG лишь третьим нуклеотидом - возможно, в этих генах (или генах, от которых они происходят) произошла мутация, в результате которой G заменился на T. Каких-либо отличительных особенностей у последовательности с таким старт-кодоном не было замечено.

3. CTG 2 – возможное происхождение от ATG - A-C замещение. Отличительных особенностей у последовательностей не отмечено.

4. GTG 338 – возможное происхождение от ATG - A-G замещение. По каким-то причинам встречается гораздо чаще, чем ATT, CTG, TTG, хотя также, как и эти старт-кодоны отличаются от ATG на один нуклеотид.

5. TTC 1 - короткая последовательность с таким кодоном в начале является псевдогеном (pseudo=true).

6. TTG 80 – возможное происхождение от ATG - A-T замещение. Относительно часто встречается (но реже, чем GTG). С чем связана частота неATG-старт-кодонов неизвестно. Возможные варианты: и A, и G являются пуриновыми основаниями (т. е. могут обладать какими-либо похожими свойствами), встреченными (как первые нуклеотиды в старт-кодонах ATG и GTG) 3890 и 338 раз соответственно, T комплементарен A =>(?) встречается TTG много чаще чем CTG. Цитозин и аденин не являются комплементарными и принадлежат разным группам азотистых оснований =>(?) CTG встречен лишь дважды.

Candidatus Gracilibacteria bacterium 28_42_T64:

1. ACA 1 - последовательность является коротким псевдогеном.

2. ATG 1129 - норма.

3. GTG 41 - как у E. coli относительно часто встречается. Возможно, из-за каких-то общих черт с ATG в следствие незначительного отличия - на один нуклеотид.

4. TCA 1 - последовательность является коротким псевдогеном.

5. TCT 1 - последовательность является коротким псевдогеном.

6. TTG 23 - как у E. coli относительно часто встречается. Возможно, из-за каких-то общих черт с ATG в следствие незначительного отличия - на один нуклеотид.

Mycoplasma pneumoniae M29:

1. AAA 1 - псевдоген.

2. ACT 1 - псевдоген.

3. ATA 4 - 3 из 4 - псевдогены.

4. ATC 1 - отличен от ATG на один последний нуклеотид.

5. ATG 629 - норма.

6. ATT 8 - 1 из 8 - псевдоген.

7. CAA 2 - псевдогены.

8. CTC 2 - псевдогены.

9. CTG 1 - отличен от ATG на первый нуклеотид

10. GAA 1 - псевдоген.

11. GGA 1 - псевдоген.

12. GTG 60 - относительная норма - GTG в роли старт-кодона уже встречался в значимых количествах в других бактериях.

13. GTT 1 - псевдоген.

14. TCT 1 - псевдоген.

15. TTA 3 - 2 из 3 - псевдогены

16. TTG 53 - относительная норма - TTG в роли старт-кодона уже встречался в значимых количествах в других бактериях.

Общие тенденции:

ATG - главный старт-кодон, GTG и TTG - достаточно широко распространённые старт-кодоны, другие кодоны встречаются в единичных экземплярах и начинают (как правило) псевдогены.


Задание 2

Полученные последовательности для E. coli str. K-12 substr. MG1655:

1) lcl|U00096.3_cds_b4587_250 ... [pseudo=true] ... - псевдоген с 4 стоп-кодонами.

2) lcl|U00096.3_cds_AAD13438.1_1459 ...[protein=formate dehydrogenase N subunit alpha][transl_except=(pos:586..588,aa:Sec)] ... [location=1547401..1550448] ... - такая отметка есть только у этой последовательности и двух ниже в данном геноме. [transl_except=(pos:586..588,aa:Sec)] - исключение трансляции в позиции [586;588] (которая соответствует стоп-кодону). Эта позиция находится довольно далеко от конца гена и, скорее всего, игнорируется в результате трансляции.

3) lcl|U00096.3_cds_AAD13456.1_3824 ... [protein=formate dehydrogenase O subunit alpha][transl_except=(pos:586..588,aa:Sec)] ... [location=complement(4082772..4085822)] ... - аналогично предыдущей последовательности 2). Любопытно, что последовательности 2) и 3) очень похожи друг на друга (это видно), длины отличаются лишь на три нуклеотида, а позиции стоп-кодонов совпадают.

4) lcl|U00096.3_cds_AAD13462.1_3997 ... [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] ... - как и в двух последовательностях выше, у этой в оглавлении есть запись об исключении трансляции стоп-кодона по середине. Интересно, что все три последние последовательности кодируют дегидрогеназы.


Задание 3:

E. coli str. K-12 substr. MG1655:

TGA 1246

TAA 2761

TAG 306

ATA 1 - псевдоген

GAA 1 - псевдоген (далее ПГ)

Candidatus Gracilibacteria bacterium 28_42_T64:

TAA 1000

TAG 188

TCT 2 - ПГ

TTA 1 - ПГ

AAA 1 - ПГ

CTT 1 - ПГ

ACA 1 - ПГ

TGA 1 - ПГ

GAA 1 - ПГ

TGA 0 - ?

Mycoplasma pneumoniae M29:

TAG 221 - норма

TAA 533 - норма

ACT 1

ATA 1

GGG 4

AAT 1

CCC 1

GGT 1

GAT 1

TAT 1

ATT 1

TAC 1

AAA 1

TTA 1 - все ПГ

TGA 0 - ?

Почему нет TGA стоп-кодонов у двух последних бактерий?

Было замечено, что у бактерий Gracilibacteria кодон UGA в иРНК преимущественно кодирует глицин[1], а у Mycoplasma pneumoniae - триптофан[2]. UGA комплементарен ACT, а ACT - TGA. Таким образом TGA в рассматриваемых последовательностях является кодирующим (глицин или триптофан) кодоном, а не стоп-кодоном.

[1] - Recoding of the stop codon UGA to glycine by a BD1-5/SN-2 bacterium and niche partitioning between Alpha- and Gammaproteobacteria in a tidal sediment microbial community naturally selected in a laboratory chemostat. PMCID: PMC4032931. PMID: 24904545 Anna Hanke, Emmo Hamann, Ritin Sharma, Jeanine S. Geelhoed, Theresa Hargesheimer, Beate Kraft, Volker Meyer, Sabine Lenk, Harald Osmers, Rong Wu, Kofi Makinwa, Robert L. Hettich, Jillian F. Banfield, Halina E. Tegetmeyer, and Marc Strous

[2] - Mycoplasma pneumoniae and Its Role as a Human Pathogen. PMCID: PMC523564. PMID: 15489344 Ken B. Waites, and Deborah F. Talkington


Задание 4:

E. coli str. K-12 substr. MG1655:

CTG 71292

TTA 18497

TTG 18295

CTC 14951

CTT 14726

CTA 5203

CTG - максимум

CTA - минимум

Candidatus Gracilibacteria bacterium 28_42_T64:

TTA 14758

CTT 9330

CTC 3968

CTA 3357

TTG 3236

CTG 1713

TTA - максимум

CTG - минимум

Mycoplasma pneumoniae M29:

TTA 10307

TTG 5572

CTC 3139

CTA 2852

CTT 2788

CTG 2474

TTA - максимум

CTG - минимум

Candidatus Gracilibacteria и Mycoplasma pneumoniae имеют одинаковые часто и редко встречаемые кодоны ТТА и CTG соответственно. У Escherichia coli наоборот, CTG чаще встречается, чем другие кодоны, а СТА - реже.


Задание 5:

cumulative GC-skew Escherichia coli str. K-12 substr. MG1655

https://docs.google.com/spreadsheets/d/1An1x5y3cU0nF6vsUCkTJ2-M88UrArWwgFago7-qvzMI/edit#gid=773859179

минимум -28,328 позиция 3.870.000 - середина гена

максимум 47,733 позиция 1.513.000 - середина гена

https://colab.research.google.com/drive/1nD-Oz7u2lj8u4jfBvGsTUMgTlt38dw8W

Users/kmvmax (последним исправлял пользователь kmvmax 2023-12-23 13:34:52)