Электронная библиотека » Евгений Кунин » » онлайн чтение - страница 19


  • Текст добавлен: 16 июня 2014, 17:04


Автор книги: Евгений Кунин


Жанр: Биология, Наука и Образование


Возрастные ограничения: +16

сообщить о неприемлемом содержимом

Текущая страница: 19 (всего у книги 41 страниц)

Шрифт:
- 100% +

Еще одно направление экспериментальных исследований могло бы сконцентрироваться на необычных бактериях, таких как Planctomycetes, которые обладают внутриклеточными компартментами, заключающими в себе хромосому (Fuerst, 2005). Конечно, эти организмы – прокариоты по всем критериям[65]65
  Уже после публикации английского оригинала этой книги на страницах солидных журналов разгорелись довольно жаркие дебаты о природе сходства внутриклеточной организации «ядерных» бактерий и эукариот (Devos DP, Reynaud EG. Evolution. Intermediate steps. Science. 2010 Nov 26;330(6008):1187-8; McInerney JO, Martin WF, Koonin EV, Allen JF, Galperin MY, Lane N, Archibald JM, Embley TM. Planctomycetes and eukaryotes: a case of analogy not homology // Bioessays. 2011 Nov;33(11):810-7; Reynaud EG, Devos DP. Transitional forms between the three domains of life and evolutionary implications // Proc Biol Sci. 2011 Nov 22;278(1723):3321-8; Devos DP. Regarding the presence of membrane coat proteins in bacteria: confusion? What confusion? Bioessays. 2012 Jan;34(1):38-9). Во второй из цитируемых статей мы с коллегами приводим ряд конкретных аргументов в пользу того, что это сходство представляет собой аналогию (то есть результат независимой эволюции внешне сходных черт), а никак не гомологию (то есть происхождение от общего предка). Мне эти аргументы и теперь кажутся вполне убедительными.


[Закрыть]
. Более того, сравнительный анализ геномов показывает, что они не кодируют гомологов белковых субъединиц комплекса ядерной поры (Mans et al., 2004). Наша модель предсказывает, что, хотя Planctomycetes и некоторые родственные бактерии обладают «ядроподобным» компартментом, у них сохраняется сопряжение транскрипции и трансляции, типичное для прокариот. Это означает, что функциональные рибосомы входят в «ядерный» компартмент и инициируют трансляцию матричных РНК еще до завершения их транскрипции, или же образующиеся молекулы мРНК одновременно с транскрипцией выталкиваются через отверстия в стенках компартмента.

Если, напротив, эксперименты покажут, что у «ядерных» бактерий транскрипция разобщена с трансляцией, то это будет серьезным возражением против нашей модели. Немедленным ee опровержением было бы открытие ныне существующих архезой, то есть свободноживущих эукариот, не имеющих никаких признаков МПО, однако обладающих всеми остальными типичными признаками эукариотической клеточной организации. (Паразит с сильно редуцированным геномом, однако, не будет здесь убедительным примером.) Вероятность того, что архезои будут однажды открыты, уменьшается с каждым случаем обнаружения еще одной группы простейших, не имеющих нормальных митохондрий, но все-таки содержащих МПО.

Удивительная история эукариотических интронов

«Кусочное» (экзон-интронное) строение белок-кодирующих (и некоторых РНК-кодирующих) генов эукариот – поистине удивительная черта (она не всегда кажется нам таковой только потому, что нам так привычна концепция сплайсинга, да и открыта она, на момент написания этой книги, более 30 лет назад). Почему гены разрываются множеством некодирующих участков, большинство которых не выполняет никаких видимых функций и вырезается из транскрипта сложной молекулярной машиной (предназначенной специально для этой цели) только для того, чтобы быть разрушенными? Кажется, это превосходит все, что может нарисовать себе самое смелое воображение. Когда интроны были открыты в 1977 году, Уолтер Гилберт[66]66
  Лауреат Нобелевской премии по химии (вместе с Фредом Сэнгером) за разработку одного из двух первых эффективных методов секвенирования ДНК.


[Закрыть]
немедленно выступил с привлекательной «гипотезой ранних интронов», послужившей основой так называемой «экзонной теории генов» (Gilbert, 1978). Вкратце, Гилберт предположил, что интроны сопутствовали жизни на самых ранних этапах эволюции и играли ключевую роль в эволюции белок-кодирующих генов, позволяя соединять короткие последовательности, кодирующие первичные пептиды, путем рекомбинации ближайших некодирующих последовательностей. Вслед за формулировкой этой идеи последовали 20 лет попыток подтвердить существование первичных интронов путем анализа разнообразных признаков интронов ныне существующих (de Souza et al., 1998). Мы не станем описывать здесь эту борьбу; достаточно лишь сказать, что убедительных свидетельств найдено не было. Безусловно, гипотеза ранних интронов не поддерживается тем фактом, что у прокариот не обнаружены сплайсосомы и интроны сплайсосомного типа, хотя Гилберт и его коллеги утверждают, что это результат эволюционного упрощения. Возможно, самый серьезный аргумент против «ранних интронов» – это обнаружение предковой связи между бактериальными самосплайсирующимися интронами и сплайсосомными интронами. Из этого открытия следует, что, даже если на самых ранних стадиях эволюции жизни существовали интроны (мы еще вернемся к этому моменту в гл. 10 и 11), эти интроны были совершенно не такими, как современные сплайсосомные интроны, и последние не могут нести какую-либо «память» о первичной эволюции. Сплайсосомные интроны и вся система сплайсинга, таким образом, суть чисто эукариотические черты из тех, что определяют «эукариотическое состояние».

Так почему же эукариотические гены прерываются таким множеством интронов? По-видимому, единственный разумный ответ следующий: потому что их предки агрессивно встраивались в эукариотические гены во время эукариогенеза или вскоре после него, а механизмы, служащие для эффективного удаления их из первичных транскриптов, развились и обеспечили выживание линии организмов со странными «кусочными» генами. После этого давление отбора, направленное на устранение интронов, во многих линиях эукариот оказалось недостаточно сильным, чтобы избавиться от большинства из них, хотя именно это произошло в других линиях, эволюционировавших в условиях сильного очищающего отбора (см. гл. 8). Разумеется, это не отменяет функциональной значимости интронов вообще: известно, что некоторые из них вносят вклад в регуляцию экспрессии (Le Hir et al., 2003), а другие даже содержат встроенные гены (Assis et al., 2008). Более того, интроны обеспечивают возможность альтернативного сплайсинга, ключевого механизма, создающего структурное и функциональное разнообразие белков у многоклеточных эукариот (см. гл. 8). В целом, однако, неискоренимое присутствие интронов, по-видимому, в большой степени зависит от силы очищающего отбора, направленного на их устранение. Популяционно-генетические аспекты утраты и приобретения интронов будут рассмотрены в главе 8; здесь я кратко обсуждаю результаты реконструкций эволюции интронов и некоторые дополнительные идеи, касающиеся природы геномов самых ранних эукариот в свете рассмотренного выше сценария эукариогенеза.

Эукариоты сильно различаются по характеру интронов: многие протисты и одноклеточные грибы содержат всего несколько интронов на весь геном, тогда как животные, растения и некоторые из простейших богаты интронами, так что кодирующие последовательности большинства их генов прерываются несколькими интронами (Jeffares et al., 2006). Замечательно, что позиции большой доли интронов консервативны у ортологичных генов разных организмов, включая растения и животных (Rogozin et al., 2003). Эволюционные реконструкции, принимающие во внимание консервативные и вариабельные позиции интронов, приводят к неожиданному выводу о том, что гены LECA были почти так же насыщены интронами, как и у современных млекопитающих, и значительная часть интронов LECA сохранилась по сей день в тех же позициях (см. рис. 7–8; Csuros et al., 2011). Этот вывод может казаться странным, но чем больше геномов становится доступно для анализа все более точными методами реконструкции, тем более убедительным он оказывается. Из этого наблюдения, формально подтвержденного результатами реконструкций, следует, что дальнейшая эволюция вела в первую очередь к утрате интронов, происходившей в большинстве ветвей эукариот, а немногие эпизоды взрывного увеличения их количества, по-видимому, были связаны с появлением новых крупных ветвей, таких как растения и животные (см. рис. 7–8). Резкое увеличение числа интронов у основания супергруппы Plantae могло быть обусловлено новой волной интронов группы II, перешедших от цианобактериального симбионта. Источник интронов у основания ветви животных остается загадочным и даже может свидетельствовать о роли скрытого эндосимбиоза в происхождении животных.

Реконструкция (см. рис. 7–8) была проведена с использованием методов Монте-Карло и марковских цепей (Csuros et al., 2011). Показана плотность интронов (число интронов на 1 Кб) для ныне существующих форм и предполагаемая плотность для ключевых предковых форм. Насыщенность черной штриховки приблизительно пропорциональна плотности интронов. Линия человека отмечена кружком. Показаны три супергруппы эукариот (Chromalveolata, Unikonta и Plantae) и основные группы внутри каждой из них, для которых известны полные последовательности геномов и соответствующие данные по локализации интронов[67]67
  Сокращенные наименования видов: Aureococcus anophagefferens (Aano), Aedes aegypti (Aaeg), Agaricus bisporus (Abis), Anopheles gambiae (Agam), Allomyces macrogynus ATCC 38327 (Amac), Apis mellifera (Amel), Aspergillus nidulans FGSC A4 (Anid), Acyrthosiphon pisum (Apis), Arabidopsis thaliana (Atha), Babesia bovis (Bbov), Batrachochytrium dendrobatidis (Bden), Branchiostoma floridae (Bflo), Botryotinia fuckeliana B05.10 (Bfuc), Brugia malayi (Bmal), Bombyx mori (Bmor), Coccomyxa sp. C-169 (C169), Chlorella sp. NC64a (C64a), Caenorhabditis briggsae (Cbri), Caenorhabditis elegans (Cele), Coprinopsis cinerea okayama7#130 (Ccin), Cochliobolus heterostrophus C5 (Chet), Coccidioides immitis RS (Cimm), Ciona intestinalis (Cint), Cryptococcus neoformansvar. neoformans (Cneo), Chlamydomonas reinhardtii (Crei), Capitella teleta (Ctel), Capsaspora owczarzaki ATCC 30864 (Cowc), Dictyostelium discoideum (Ddis), Dictyostelium purpureum (Dpur), Drosophila melanogaster (Dmel), Drosophila mojavenis (Dmoj), Daphnia pulex (Dpul), Danio rerio (Drer), Entamoeba dispar (Edis), Entamoeba histolytica (Ehis), Emiliania huxleyi (Ehux), Fragilariopsiscylindrus (Fcyl), Phanerochaete chrysosporium (Fchr), Phaeodactylum tricornutum (Ftri), Gallus gallus (Ggal), Gibberella zeae PH-1 (Gzea), Hydra magnipapillata (Hmag), Helobdella robusta (Hrob), Homo sapiens (Hsap), Ixodes scapularis (Isca), Laccaria bicolor (Lbic), Lottia gigantea (Lgig), Micromonas sp. RCC299 (M299), Monosiga brevicollis (Mbre), Mucor circinelloides (Mcir), Mycosphaerella fijiensis (Mfij), Mycosphaerella graminicola (Mgra), Magnaporthe grisea 70–15 (Mgri), Melampsora laricis-populina (Mlar), Micromonas pusilla CCMP1545 (Mpus), Neurospora crassa OR74A (Ncra), Nematostella vectensis (Nvec), Nasonia vitripennis (Nvit), Ostreococcus sp. RCC809 (O809), Ostreococcus lucimarinus (Oluc), Oryza sativa japonica (Osat), Ostreococcus taurii (Otau), Phytophthora capsici (Pcap), Plasmodium falciparum (Pfal), Puccinia graminis (Pgra), Pediculus humanus (Phum), Phaeosphaeria nodorum SN15 (Pnod), Physcomitrella patens subsp. patens (Ppat), Phytophthora ramorum (Pram), Pyrenophora tritici-repentis Pt-1C-BFP (Prep), Proterospongia sp. ATCC 50818 (Prsp), Phytophthora sojae (Psoj), Paramecium tetraurelia (Ptet), Plasmodium vivax (Pviv), Plasmodium yoelii yoelii (Pyoe), Rhizopus oryzae (Rory), Sorghum bicolor (Sbic), Saccharomyces cerevisiae (Scer), Schizosaccharomyces japonicas yFS275 (Sjap), Schistosoma mansoni (Sman), Selaginella moellendorffii (Smoe), Schizosaccharomyces pombe (Spom), Spizellomyces punctatus DAOM BR1173 (Spun), Strongylocentrotus purpuratus (Spur), Sporobolomyces roseus (Sros), Sclerotinia sclerotiorum 1980 UF-70 (Sscl), Trichoplax adhaerens (Tadh), Theileria annulata (Tann), Tribolium castaneum (Tcas), Toxoplasma gondii (Tgon), Taenopygia guttata (Tgut), Theileria parvum (Tpar), Thalassiosira pseudonana (Tpse), Tetrahymena thermophila (Tthe), Ustilago maydis 521 (Umay), Uncinocarpus reesii 1704 (Uree), Volvox carteri (Vcar), Vitis vinifera (Vvin).


[Закрыть]
.


Рис. 7–8. Реконструкция приобретения и утраты интронов в течение эволюции эукариот и плотности интронов у предковых форм.


По: Csuros et al., 2011. Данная статья находится в свободном доступе под Атрибутивной лицензией Creative Commons.

Таким образом, LECA, по-видимому, аккумулировал интроны до плотности, близкой к наиболее богатым интронами современным геномам. Что же можно сказать о динамике интронов в течение стволовой фазы, между эукариогенезом и LECA? Простой расчет показывает, что, если инвазия интронов произошла «мгновенно», то протоэукариотический геном должен был большей частью (до 80 процентов) состоять из интронов, учитывая большие и единообразные размеры интронов группы II (около 2,5 Кб; Koonin, 2009b). Скорее всего, это чрезмерное упрощение. Процесс аккумуляции интронов, вероятно, был более постепенным и сопровождался уменьшением встроившихся интронов. Как бы то ни было, интроны, по всей видимости, сыграли ключевую роль в самом начале эволюции эукариот, согласно обсуждаемой модели эукариогенеза.


Рис. 7–9. Пересмотр трех доменов жизни: а – традиционное трехдоменное дерево Вёзе; б – циклический граф трех доменов согласно симбиогенетическому сценарию эукариогенеза и ГПГ между доменами.

Три домена жизни: за пределами дерева Вёзе

Симбиогенетический сценарий эукариогенеза ведет к пересмотру трехдоменного дерева жизни, разработанного Вёзе и его коллегами, даже если не учитывать последствия широкомасштабного ГПГ между прокариотами, что обсуждалось в главах 5 и 6. Дерево Вёзе подразумевает архезойный сценарий, а эндосимбиоз рассматривается как относительно позднее событие в истории эукариотического домена, которое не имеет отношения к трехдоменной классификации жизни (см. рис. 7–9а). Напротив, симбиогенетический сценарий постулирует, что захват первичного эндосимбионта буквально дал начало эукариотическому домену и, в процессе, внес большое число (возможно, большинство) генов в развивающийся эукариотический геном. Согласно последнему сценарию, слияние организмов из двух первичных доменов дало начало третьему домену; тогда конечная диаграмма не будет представлять собой дерево (см. рис 7–9б). Важное следствие, к которому мы вернемся в главе 11, состоит в том, что, размышляя о происхождении клеток, мы должны думать только о двух прокариотических доменах: археях и бактериях.

Краткий обзор главы

Среди трех доменов жизни эукариоты, без сомнений, обладают самой сложной, поразительно изощренной клеточной организацией, которая может даже навести некоторых на мысли о «неупрощаемой сложности» (Kurland et al., 2006), так как для большинства характерных функциональных систем эукариотических клеток мы не можем найти эволюционные промежуточные формы. Естественно, эукариогенез представляется одной из важнейших проблем эволюционной биологии, задачей, для решения которой «в лоб» мы гораздо лучше оснащены, чем для решения более фундаментальных задач происхождения клетки и, в конце концов, происхождения жизни (см. гл. 11 и 12). Сравнительная геномика на сегодняшний день не смогла ни разгадать загадку эукариогенеза, ни предложить исчерпывающую картину первичного расхождения главных эукариотических линий. Тем не менее филогенетический анализ во многих случаях внес ясность в вопросы, связанные с происхождением и самыми ранними этапами эволюции эукариот. Так, филогеномика прояснила эволюционные связи между царствами эукариот и привела к выявлению пяти или шести супергрупп. Родственные связи между супергруппами и корнем древа эукариот остаются чрезвычайно сложными для расшифровки, возможно по причине сжатого кладогенеза при первичном расхождении главных ветвей эукариот. Продолжающийся сбор данных по геномам различных ветвей жизни – отнюдь не игра в бирюльки; напротив, сравнительный анализ различных геномов продолжает приносить неожиданные биологические открытия, так что ожидать, безусловно, следует еще большего.

Ультраструктурные, функциональные и геномные данные согласованно свидетельствуют о том, что эукариоты являются археобактериальными химерами. Более того, гены явно бактериального происхождения существенно превышают по численности «архейные» гены. Более того, сравнительный анализ растущей коллекции доступных геномов архей все увереннее показывает, что многие ключевые клеточные системы эукариот существуют в примитивных формах уже у архей. Вариабельность этих систем между разными линиями архей, вместе с филогенезом консервативных белков, говорит о том, что архейный предок эукариот принадлежал к глубокой, возможно вымершей ветви архей с геномом высокой сложности и разработанными клеточными функциями. Недавнее открытие возможного прямого предка убиквитиновой системы в новом архейном геноме говорит о том, что мы можем в настоящее время недооценивать, насколько многие типичные функциональные системы эукариот могли быть представлены в течение эволюции Archaea. Это и другие подобные открытия внушают доверие к «комбинированному сценарию» происхождения эукариот, согласно которому эти заранее сформировавшиеся системы случайно сочетались в архейном хозяине первичного эндосимбионта. Напротив, системы внутренних мембран эукариот – особенно ядро, с его сложным комплексом ядерной поры – не обнаружены у архей и, по-видимому, были собраны, по крайней мере частично, из предковых бактериальных компонентов. Представляется важным, что эукариоты унаследовали развитые, сложно организованные системы от архей (естественно, за исключением митохондрий), тогда как многочисленные бактериальные молекулярные компоненты были в основном унаследованы по одному, a новые молекулярные машины возникли путем рекомбинации. Это различие, по-видимому, отражает асимметрию между хозяином и эндосимбионтом: несмотря на все драматические инновации, сопровождавшие эукариогенез, многие клеточные системы архейного хозяина сохранились и изменялись только эволюционным (плавным) путем, посредством дупликаций и приобретения дополнительных деталей.

Все вместе эти наблюдения, по-видимому, лучше всего совместимы с симбиогенетическим сценарием происхождения эукариот. Согласно этому сценарию, эукариогенез был инициирован эндосимбиозом альфа-протеобактерии с предковыми археями, а система внутренних мембран, в том числе ядро, появилась как защита против вторжения интронов. Более того, остальные ключевые нововведения эукариотической клетки, такие как нонсенс-опосредованный распад ошибочных транскриптов и значительное усложнение убиквитин-зависимой системы деградации аберрантных белков, по-видимому, логически объясняются как дополнительные линии защиты против той же инвазии. Косвенно гипотеза защиты может вносить вклад в понимание эволюции других главных черт эукариот, таких как исчезновение оперонов и переход от кольцевых хромосом к линейным. Подводя итог, можно сказать, что сейчас мы имеем достаточно согласованную, хотя, конечно, слишком схематичную хронику эукариогенеза. Завершая эту главу, я хочу подчеркнуть, что, несмотря на многочисленные детали, остающиеся неясными, история эукариогенеза является идеальной демонстрацией главной темы настоящей книги: взаимодействия между случайностью и необходимостью в эволюции жизни. В самом деле, захват протомитохондриального эндосимбионта, несомненно, был ключевым событием эукариогенеза, и партнеры этого симбиоза были «выбраны» случаем. Тем не менее этот симбиоз, судя по всему, инициировал сложную цепь событий, многие элементы которой были необходимы для того, чтобы обеспечить выживание химерного организма, и мы знаем, что на нашей планете эукариоты действительно выжили и достигли беспрецедентной сложности и разнообразия.

Рекомендуемая дополнительная литература

Doolittle W. F. (1998) You Are What You Eat: A Gene Transfer Ratchet Could Account for Bacterial Genes in Eukaryotic Nuclear Genomes. Trends in Genetics 14: 307–311.

По-видимому, первое описание храповика переноса генов от эндосимбионтов к хозяину, правда в контексте архезойного сценария.

Embley T. M., and W. Martin. (2006) Eukaryotic Evolution, Changes, and Challenges. Nature 440: 623–630.

Глубокий аналитический обзор различных сценариев эукариогенеза в свете представления о том, что все эукариоты обладают митохондриями или МПО.

Koonin E. V. (2010) The Origin and Early Evolution of Eukaryotes in the Light of Phylogenomics. Genome Biology 11: 209.

Рассмотрение родственных связей между супергруппами эукариот, природы LECA и эукариогенеза, с упором на высокую сложность LECA.

Koonin E. V. (2006) The Origin of Introns and Their Role in Eukaryogenesis: A Compromise Solution to the Introns-Early Versus Introns-Late Debate? Biology Direct 1: 22.

Дальнейшее развитие защитного сценария эукариогенеза, запущенного инвазией интронов и включающего единую цепь причинно-следственных связей, обусловливающих происхождение различных специфичных для эукариот функциональных систем.

Kurland C. G., L. J. Collins, and D. Penny. (2006) Genomics and the Irreducible Nature of Eukaryote Cells. Science 312: 1,011—1,014.

Воодушевленное выступление против эндосимбиотического сценария эукариогенеза и за первичное происхождение сложности эукариот.

Lane N., and W. Martin. (2010) The Energetics of Genome Complexity. Nature 467: 929–934.

Гипотеза о неизбежности эндосимбиоза, который интерпретируется как единственный путь к эффективной биоэнергетике, необходимой для эволюции больших сложных клеток.

Martin W., and E. V. Koonin. (2006) Introns and the Origin of Nucleus-Cytosol Compartmentalization. Nature 440: 41–45.

Гипотеза о защите от инвазии интронов как факторе отбора, обусловившем возникновение ядра.

Martin W., and M. Muller. (1998) The Hydrogen Hypothesis for the First Eukaryote. Nature 392: 37–41.

Ключевая гипотеза о метаболической кооперации как факторе отбора, способствующем мутуалистическим связям между хозяином и эндосимбионтом.

Martin W., T. Dagan, E. V. Koonin, J. L. Dipippo, J. P. Gogarten, and J. A. Lake. (2007) The Evolution of Eukaryotes. Science 316: 542–543.

Опровержение аргументации Курланда с соавторами (Kurland et al., 2006).

Zimmer C. (2009) Origins. On the Origin of Eukaryotes. Science 325: 666–668.

Популярное обсуждение различных сценариев эукариогенеза.

Глава 8. Неадаптивная нулевая гипотеза эволюции генома и истоки биологической сложности

Эволюционная энтропия и сложность

Немногие модные слова в последние два десятилетия были настолько популярны и в то же время определялись столь разнообразно, зачастую противоречиво, а иногда и обманчиво, как сложность[68]68
  По различным аспектам сложности опубликовано огромное число книг, популярных и не очень, в том числе за авторством великого физика и автора теории кварков Мюррея Гелл-Манна (M. Gell-Mann. The Quark and the Jaguar: Adventures in the Simple and the Complex. New York: St. Martin’s Griffin, 1995). Более специальная книга Стюарта Кауфмана предлагает множество оригинальных идей об эволюции сложности (S. Kauffman. At Home in the Universe: The Search for the Laws of Self-Organization and Complexity. Oxford: Oxford University Press, 1996). Еще один, современный краткий текст-введение – N. Johnson. Simply Complexity: A Clear Guide to Complexity Theory. New York: Oneworld Publications, 2009.


[Закрыть]
. Несмотря на эту суету, понятие сложности, очевидно, отражает общее, фундаментально важное явление, пронизывающее всю биологию и выходящее за ее рамки. В отличие от многих научных терминов, «сложность» имеет конкретное значение в обыденном языке. Мы узнаем ее, как и порнографию[69]69
  На всякий случай – это не просто фривольная шутка, а отсылка к знаменитой фразе члена Верховного суда США Поттера Стюарта по поводу того, как распознать порнографию: «Когда я это вижу, я это узнаю».


[Закрыть]
, с первого взгляда. Все признают, что млекопитающее или птица сложнее, чем червь, а червь сложнее, чем любой одноклеточный организм. Говоря интуитивно, здесь присутствует дополнительный оттенок, устанавливающий пропорциональность сложности с «развитостью» или «приближением к совершенству».

Поднимаясь уровнем выше чистой интуиции, спросим, что означает большая сложность млекопитающего по сравнению с амебой? Этот вопрос очень важен, если мы стремимся выработать удовлетворительный ответ на известный вопрос: почему вокруг нас существуют слоны и секвойи (даже если их все меньше и меньше), а не одни лишь бактерии и археи с необходимыми и достаточными для функционирования минимальной клетки комплектами генов? Другими словами, какие факторы ведут к появлению сложности в процессе эволюции? В главе 7 мы обсуждали эволюционные сценарии, пытающиеся объяснить, как могла возникнуть поразительно сложная (по сравнению с клетками прокариот) организация эукариотической клетки. В этой главе мы столкнемся с озвученным выше вопросом «почему?» напрямую, и ответы на него будет неожиданными и, возможно, введут некоторых в замешательство.

Точное определение организационной – или, в случае биологии, организменной – сложности по самой своей природе дается трудно. Попытки в этом направлении рассматривают различное число составляющих частей в сравниваемых системах[70]70
  Наиболее глубоко этот вопрос рассматривается, по-видимому, в работах Дэна Макши, например: D.W. McShea. Functional complexity in organisms: parts as proxies. Biology and Philosophy 15 (2000): 641–668, и в недавней интересной книге: Daniel W. McShea and Robert N. Brandon (2010). Biology’s First Law: The tendency for Diversity and Complexity to Increase in Evolutionary Systems. University of Chicago Pres: Chicago.


[Закрыть]
. Например, у позвоночных большее количество тканей и типов клеток, чем у червей, и это, естественно, приводит к утверждению, что позвоночные обладают большей организменной сложностью (Bonner, 2004). Для нашего рассуждения, однако, более важен тот факт, что эукариотические клетки имеют гораздо больше внутриклеточных органелл, чем клетки прокариот (те, как правило, вообще не имеют настоящих органелл). Эта разница, безусловно, отражает большую сложность организации эукариотической клетки. Кроме того, можно было бы в принципе измерить число взаимодействий между компонентами или число соединений в сетях передачи сигнала и на этом основании сравнивать сложность организмов или клеток. Однако все эти определения сложности, видимо, упускают «нечто», что мы интуитивно воспринимаем как неотъемлемое свойство сложной организации. В любом случае количественное сравнение организменной сложности, по-видимому, не приносит много пользы в реальных исследованиях. Геномная сложность определяется более естественно и может быть изучена подробнее. Действительно, в конце концов, геномные последовательности представляют из себя длинные строки цифровых символов (букв), а для этого класса объектов хорошо известны формальные, операциональные определения сложности. Вероятно, наиболее известным и наиболее интуитивно осмысленным из них является колмогоровская сложность, которая связана с шенноновской информацией и классическим статистическим определением энтропии по Больцману. Колмогоровская сложность – это просто длина кратчайшей строки символов, в которых может быть закодирована данная последовательность (геном). Очевидно, что наименее сложной последовательностью будет гомополимер (например, polyA), для которого длина сообщения составляет лишь одну букву, а сложность (информационное содержание) – 2 бита (в случае четырех нуклеотидов). Наиболее же сложная последовательность – полностью случайный полимер с равными частотами для всех четырех нуклеотидов (или 20 аминокислот, если мы примем это определение для аминокислотных последовательностей) в каждой позиции. Классическая формула Шеннона для энтропии (информационного содержания) нуклеотидной последовательности длины L (см. рис. 8–1а) может быть записана следующим образом:



Рис. 8–1. Содержание информации и сложность: а – одной последовательности; б – выравнивания гомологичных последовательностей; f обозначает частоты нуклеотидов в последовательности (а) или столбце выравнивания (б).


Здесь fi – частота символа i (i = A, T, G, C); далее, основание логарифма m считается равным размеру алфавита (4 в случае нуклеотидных последовательностей и 20 для аминокислотных последовательностей)[71]71
  Информация эквивалентна колмогоровской сложности только для строго случайных последовательностей с предзаданными частотами символов. Геномные последовательности, как правило, не таковы – они заключают в себе зависимости между нуклеотидами в разных положениях. Несмотря на интуитивную понятность концепции колмогоровской сложности, не существует общей формулы для ее вычисления.


[Закрыть]
. Определенная таким образом, информация (энтропия) говорит нам очень мало об осмысленном информационном содержании или сложности геномной последовательности. Высокая сложность (энтропия или информационное содержание), очевидно, вовсе не предполагает, что последовательность сложна в каком-либо биологическом значимом смысле. Совершенно случайная последовательность на самом деле, скорее всего, бессмысленна, в то время как гомополимерная последовательность будет иметь ограниченный биологический смысл. Тем не менее почти случайная высокоэнтропийная последовательность может быть столь же функциональной, как и низкоэнтропийная последовательность, – способа узнать это просто не существует. Требуется биологически содержательное определение сложности, и такая попытка была сделана Крисом Адами (Adami, 2002) и несколько по-другому проинтерпретирована автором этой книги (Koonin, 2004). В соответствии с этим новым определением, энтропия и сложность рассчитываются для выравнивания ортологичных последовательностей, а не одной последовательности:



Здесь H(L) – полная энтропия выравнивания n последовательностей длины L, Hi – энтропия для сайта, а Fij – частоты для нуклеотидов (j = A, T, G, C) в сайте i[72]72
  Эти вероятности не просто являются частотами, но теоретически должны задаваться непредвзятыми статистическими моделями для отдельных сайтов, которые, хоть и не известны в явной форме, аппроксимируются различными математическими моделями, точность которых растет с увеличением числа последовательностей в выравнивании.


[Закрыть]
. Очевидно, для полностью консервативного сайта H(i) = 0, в то время как для совершенно случайного сайта H(i) = 1. Обратите внимание, что это определение энтропии полностью соответствует знаменитому статистическому определению Больцмана:

H = kln W

Здесь W — число микросостояний, соответствующих макросостоянию, для которого энтропия рассчитывается таким образом, что она равна нулю для полностью упорядоченного состояния и максимальна для полностью неупорядоченного состояния. Таким образом, определение эволюционной энтропии генома H(L), введенной предыдущей формулой, представляется физически корректным, следовательно, имеет смысл закрепить термин за обозначением этой величины. Эволюционная энтропия также имеет четкий биологический смысл: сайты с низкой энтропией сохраняются лучше и, как следствие, более важны функционально. Логично, что эти сайты несут больше информации о функционировании и эволюции рассматриваемых организмов – и о взаимодействиях между организмами и окружающей средой, что первоначально имел в виду Адами, – чем сайты с высокой энтропией (слабо сохраняемые, относительно неважные). Величина, которую можно определить как биологическую (эволюционную) сложность генома, определяется следующим образом:



Тогда биологическая (эволюционная) плотность информации может быть задана как:



Здесь N — общая длина (число нуклеотидов) генома, Li — длина геномного сегмента, подверженного измеримому отбору (как правило, ген), k — число таких сегментов в геноме, H(L) – эволюционная энтропия для сегмента L, рассчитанная по предыдущей формуле.

Точные значения H нелегко вычислить для полных геномов, поскольку распределение эволюционных ограничений никогда не известно точно (см. гл. 3). Кроме того, есть степень произвольности в выборе ортологов, включаемых для расчета в выравнивание. Тем не менее эти детали не столь важны, если нам нужна только приблизительная оценка. Действительно, доля сайтов, находящихся под отбором по всему геному, уже оценена с достаточной точностью для некоторых модельных организмов, таких как человек и дрозофила (см. гл. 3). Для других, в частности прокариот и одноклеточных эукариот, в качестве достаточного приближения можно взять долю кодирующих нуклеотидов плюс предполагаемую долю регуляторных сайтов; для участков под отбором за среднее значение энтропии можно принять H(i) = 0,5.

Сравнение оценок для H(N), C(N) и D(N) для геномов различных жизненных форм выявляет фундаментальный парадокс. Общая биологическая сложность C(N) монотонно возрастает с размером генома, в частности, для многоклеточных эукариот по сравнению с прокариотами, однако энтропия H(N) возрастает гораздо быстрее, в результате эволюционная плотность информации D(N) резко падает (см. рис. 8–2). Таким образом получается, что организмы, которые обычно воспринимаются как наиболее сложные (к примеру, человек), обладают «энтропийными» геномами с низкой или даже крайне низкой плотностью информации, в то время как организмы, которые мы традиционно считаем примитивными, такие как бактерии, обладают «информационными» геномами, в которых информация плотно упакована и плотность ее высока. Этот парадокс не даст нам много нового по сравнению с уже сказанным в главе 3 об организации различных геномов. Тем не менее поучительно формализовать понятие биологической сложности и выразить его в терминах энтропии, одного из ключевых понятий физики. Формальный разбор понятия сложности указывает на то, что «неладно что-то в Датском королевстве»: геномы организмов, которых мы вполне обоснованно считаем самыми сложными и наиболее «развитыми» (эта идея, возможно, менее оправдана), несут гораздо больше энтропии и, следовательно, имеют гораздо меньшую плотность биологической информации, чем геномы простейших клеточных форм. Перефразируя этот парадокс в более провокационной форме, геномы одноклеточных организмов (особенно прокариот) кажутся несравненно «лучше спроектированными», чем геномы растений и особенно животных.

Парадокс сложности подразумевает, что сложные черты организации геномов «высших» организмов (большие семейства паралогичных генов, сложная регуляция экспрессии генов, альтернативный сплайсинг и многое другое), вероятно, появились не в качестве прямолинейных адаптаций или «улучшений». Объяснение возникновения этих усложнений – большая проблема для эволюционной биологии; возможный ответ пришел в виде новой теории эволюции сложности, предложенной Майклом Линчем в 2003 году (Lynch and Conery, 2003).


Рис. 8–2. Зависимость эволюционной сложности C и плотности биологической информации D от размера генома. Точки – грубые оценки, полученные по приведенным в этой главе формулам, при условии Н(i) = 0,5 для несинонимичных сайтов в белок-кодирующих областях и Н(i) = 1 для других сайтов. График выполнен в двойном логарифмическом масштабе.


Страницы книги >> Предыдущая | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 | Следующая
  • 0 Оценок: 0

Правообладателям!

Это произведение, предположительно, находится в статусе 'public domain'. Если это не так и размещение материала нарушает чьи-либо права, то сообщите нам об этом.


Популярные книги за неделю


Рекомендации