|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Сначала я взяла последовательность, полученную в практикуме 6 в результате анализа хроматограммы, и использовала
blastn, чтобы найти последовательности, похожие на нее, определить, к какому гену она относится и из какого организма она взята.
Ссылка на последовательность: WS3004.fasta.
Из данных таблицы видно, что данная последовательность - часть гена, кодирующего гистон 3 (H3).
![]() ![]()
Рисунок 1 (слева). Caprella septentrionalis.
![]() ![]() ![]()
Рисунок 3 (сверху). Sicyonia ingentis.
![]() Рисунок 6. Выравнивание искомой последовательности с лучшими из найденных. Взяты последовательности из Caprella septentrionalis, Acanthonotozoma inflatum, Sicyonia ingentis, Vibilia cultripes, Margarites groenlandicus, Dyopedos porrectus, Atergatis floridus. Выравнивание построенно программой Mafft с некоторыми корректировками. Изображение получено с помощью программы Jalview, раскраска по нуклеотидам. Ниже представлена таксономия организмов из таблицы 1. Можно заметить, что достоверные находки принадлежат организмам из разнообразных таксонов. Больше всего находок принадлежит типу Arthropoda. . . . Arthropoda ..................................... 749 hits 509 orgs . . . . Pancrustacea ................................. 744 hits 508 orgs . . . . . Crustacea .................................. 517 hits 420 orgs . . . . . . Eumalacostraca ........................... 514 hits 418 orgs . . . . . . . Amphipoda .............................. 169 hits 131 orgs . . . . . . . . Senticaudata ......................... 123 hits 87 orgs . . . . . . . . . Corophiida ......................... 10 hits 6 orgs . . . . . . . . . . Caprelloidea ..................... 9 hits 5 orgs . . . . . . . . . . . Caprellidae .................... 3 hits 2 orgs . . . . . . . . . . . . Caprella septentrionalis ..... 2 hits 1 orgs . . . . . . . . . . . Dyopedos ....................... 5 hits 2 orgs . . . . . . . . . . . . Dyopedos porrectus ........... 2 hits 1 orgs . . . . . . . . Gammaridea ........................... 19 hits 17 orgs . . . . . . . . . Acanthonotozoma inflatum ........... 3 hits 1 orgs . . . . . . . . Hyperiidea ........................... 27 hits 27 orgs . . . . . . . . . Physocephalata ..................... 20 hits 20 orgs . . . . . . . . . . Vibilia .......................... 4 hits 4 orgs . . . . . . . . . . . Vibilia cultripes .............. 1 hits 1 orgs . . . . . . . Eucarida ............................... 345 hits 287 orgs . . . . . . . . Decapoda ............................. 342 hits 284 orgs . . . . . . . . . Dendrobranchiata ................... 19 hits 18 orgs . . . . . . . . . . Penaeoidea ....................... 18 hits 17 orgs . . . . . . . . . . . Sicyonia ....................... 2 hits 2 orgs . . . . . . . . . . . . Sicyonia ingentis ............ 1 hits 1 orgs . . . . . . . . . Pleocyemata ........................ 323 hits 266 orgs . . . . . . . . . . Eubrachyura ...................... 84 hits 82 orgs . . . . . . . . . . . Heterotremata .................. 74 hits 72 orgs . . . . . . . . . . . . Xanthoidea ................... 68 hits 66 orgs . . . . . . . . . . . . . Xanthidae .................. 59 hits 57 orgs . . . . . . . . . . . . . . Atergatis ................ 5 hits 5 orgs . . . . . . . . . . . . . . . Atergatis floridus ..... 1 hits 1 orgs . . . . . . . . . . Caridea .......................... 134 hits 111 orgs . . . . . . . . . . . Alpheoidea ..................... 25 hits 22 orgs . . . . . . . . . . . . Hippolytidae ................. 22 hits 19 orgs . . . . . . . . . . . . . Hippolyte .................. 3 hits 3 orgs . . . . . . . . . . . . . . Hippolyte sp. WS2316 ..... 1 hits 1 orgs . . . Polychaeta ..................................... 78 hits 66 orgs . . . . Scolecida .................................... 37 hits 33 orgs . . . . . Opheliidae ................................. 28 hits 24 orgs . . . . . . Ophelia .................................. 5 hits 3 orgs . . . . . . . Ophelia limacina ....................... 3 hits 1 orgs . . Lophotrochozoa ................................... 317 hits 176 orgs . . . Mollusca ....................................... 238 hits 109 orgs . . . . Gastropoda ................................... 231 hits 105 orgs . . . . . Vetigastropoda ............................. 25 hits 24 orgs . . . . . . Trochoidea ............................... 11 hits 10 orgs . . . . . . . Trochidae .............................. 5 hits 5 orgs . . . . . . . . Margarites groenlandicus ............. 1 hits 1 orgs
2 лучшие находки с одинаковым score - последовательности из Caprella septentrionalis и Acanthonotozoma inflatum (идентификаторы в GenBank
KJ530684.1 и
KJ530650.1). Обе эти последовательности были отсеквенированы методом Сэнгера на
Белом море. Однако можно предположить, что данная последовательность принадлежит геному именно Caprella septentrionalis, так как, во-первых, длина выравнивания
искомой последовательности с найденными больше в первом случае (из обсуждаемых двух), во-вторых, находок из таксона, к которому принадлежит этот организм, гораздо
больше, чем из подотряда Gammaridea, к которому принадлежит Acanthonotozoma inflatum. Несмотря на это, сходство найденной последовательности с геном
Acanthonotozoma inflatum выше, чем с геном Caprella septentrionalis.
Далее я провела поиск последовательности тремя разными алгоритмами blast (blastn, megablast и discontiguous megablast). Так как по таксонам Amphipoda и более низшим все находки получались с практически одинаковым сходством и различия трех алгоритмов blast были не особо заметны, я решила провести поиск по таксону Polychaeta. В таблице 2 представлены резултьтаты.
Из таблицы 2 видно, что megablast и discontiguous megablast отрезают находки со слишком высоким E-value, при этом порог для megablast
значительно выше. Также в megablast не могут найтись последовательности с низким query cover, потому что паттерн для поиска этим алгоритмом составляет 28 букв (для
остальных - 11 букв). Таким образом, короткие находки, которые не являются 100% гомологичными искомой последовательности, найти затруднительно. По общему числу находок и по значениям
E-value видно, что megablast можно использовать для поиска только гомологичных последовательностей. Сходство для худшей находки в случае с megablast
получилось относительно низким, так как находки, полученные другими алгоритмами, представляют небольшие участки локального сходства и не могут служить доказательством гомологии последовательностей
целиком. Если взять результаты выдач discontiguous megablast и blastn с таким же query cover, их сходство будет составлять 75%.
Далее я проверила наличие гомологов некоторых белков в геноме Amoboaphelidium (ссылка на сборку генома). Я выбрала следующие белки, которые должны встречаться практически у всех эукариот:
В геноме Amoboaphelidium были найдены все вышеперечисленные белки. Для поиска я использовала локальный blast. Результаты поиска представлены в таблице 3.
* - находок всего 4, они принадлежат двум разным записям - scaffold-444 и scaffold-8 - по две находки каждой. Далее в скобках указаны параметры для второй
находки из той же записи. Находки во второй записи, возможно, являются копиями этого гена, полученными от родителей, так как они также имеют достаточно высокое сходство.
![]() Рисунок 7. Выравнивание последовательности белка SRP68 и его предположительного гомолога из сборки генома X5 для лучшей находки. Также указаны параметры выравнивания, такие как E-value и Score.
Далее приведены данные, выданные программой tblastn при локальном запуске.
# TBLASTN 2.2.28+ # Query: sp|O14746|TERT_HUMAN Telomerase reverse transcriptase OS=Homo sapiens GN=TERT # Database: X5 # Fields: subject id, % identity, alignment length, mismatches, gap opens, q. start, q. end, s. start, s. end, evalue, bit score # 3 hits found scaffold-17 26.58 568 374 17 452 1007 610942 612552 8e-23 105.0 unplaced-307 24.87 579 372 17 452 1007 14902 16518 5e-18 90.1 scaffold-361 29.63 81 54 2 409 487 82346 82107 1.9 32.0 # TBLASTN 2.2.28+ # Query: sp|Q15021|CND1_HUMAN Condensin complex subunit 1 OS=Homo sapiens GN=NCAPD2 # Database: X5 # Fields: subject id, % identity, alignment length, mismatches, gap opens, q. start, q. end, s. start, s. end, evalue, bit score # 4 hits found scaffold-444 23.04 690 477 16 622 1290 767041 765071 2e-33 141.0 scaffold-444 24.79 242 149 9 215 437 767983 767300 3e-07 54.7 scaffold-8 27.17 254 184 1 1037 1289 72563 71802 1e-21 102.0 scaffold-8 30.25 119 74 2 326 437 74378 74028 2e-06 52.4 # TBLASTN 2.2.28+ # Query: sp|P57740|NU107_HUMAN Nuclear pore complex protein Nup107 OS=Homo sapiens GN=NUP107 # Database: X5 # Fields: subject id, % identity, alignment length, mismatches, gap opens, q. start, q. end, s. start, s. end, evalue, bit score # 4 hits found scaffold-104 29.37 126 80 3 350 468 344639 344268 1e-06 52.0 scaffold-51 29.91 107 69 2 350 451 7114 6797 7e-06 49.7 scaffold-157 30.86 81 44 3 255 329 687312 687536 2.7 31.2 scaffold-22 32.58 89 46 4 657 731 16915 17181 5.1 30.4 # TBLASTN 2.2.28+ # Query: sp|Q9UHB9|SRP68_HUMAN Signal recognition particle subunit SRP68 OS=Homo sapiens GN=SRP68 # Database: X5 # Fields: subject id, % identity, alignment length, mismatches, gap opens, q. start, q. end, s. start, s. end, evalue, bit score # 3 hits found scaffold-687 31.97 122 73 2 58 169 58752 58387 0.005 39.7 scaffold-17 30.47 128 79 2 52 169 1907270 1906887 0.027 37.4 scaffold-451 39.39 33 20 0 591 623 10084 9986 4.5 30.0 # TBLASTN 2.2.28+ # Query: sp|P35580|MYH10_HUMAN Myosin-10 OS=Homo sapiens GN=MYH10 # Database: X5 # Fields: subject id, % identity, alignment length, mismatches, gap opens, q. start, q. end, s. start, s. end, evalue, bit score # 22 hits found scaffold-444 54.09 880 378 12 27 899 223879 226461 0.0 929.0 scaffold-444 36.88 789 447 15 71 833 36804 34513 3e-124 439.0 scaffold-444 39.53 635 348 12 177 806 302716 304527 9e-122 403.0 scaffold-444 39.68 63 38 0 116 178 302475 302663 9e-122 48.5 scaffold-444 48.39 31 16 0 86 116 302326 302418 9e-122 28.5 scaffold-444 33.80 713 412 20 88 774 837662 835626 6e-92 334.0 scaffold-444 29.93 147 103 0 1522 1668 228319 228759 1e-04 47.0 scaffold-17 54.05 877 383 12 27 899 949004 951586 0.0 927.0 scaffold-17 37.34 798 431 19 71 833 763565 761274 2e-126 446.0 scaffold-17 39.16 641 342 13 177 806 1027474 1029285 1e-120 390.0 scaffold-17 33.86 127 62 2 74 178 1027040 1027420 1e-120 64.7 scaffold-17 33.85 901 434 26 80 856 1548469 1545881 7e-113 402.0 scaffold-17 35.41 740 426 18 93 818 1463980 1461875 5e-103 370.0 scaffold-17 29.25 147 104 0 1522 1668 953444 953884 8e-04 44.3 scaffold-17 24.10 166 126 0 1769 1934 955361 955858 0.96 33.9 scaffold-105 33.93 896 437 27 80 856 459170 461749 1e-107 385.0 scaffold-105 35.25 732 422 17 101 818 549497 551578 6e-101 363.0 scaffold-20 33.52 713 414 19 88 774 32893 30857 2e-89 325.0 scaffold-693 27.07 676 435 21 98 734 662953 664923 2e-49 194.0 scaffold-170 27.01 685 442 21 89 734 88474 90471 4e-49 194.0 unplaced-997 24.88 406 254 10 152 506 9066 7849 5e-21 101.0 scaffold-140 19.88 171 118 5 333 487 225026 224523 0.056 38.1 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
© Наталия Кашко, 2015 |