Текст книги "Биологическая систематика: Эволюция идей"
Автор книги: Игорь Павлинов
Жанр: Биология, Наука и Образование
Возрастные ограничения: +12
сообщить о неприемлемом содержимом
Текущая страница: 25 (всего у книги 78 страниц) [доступный отрывок для чтения: 25 страниц]
Из значимых вопросов технического характера следует отдельно упомянуть определение формальных свойств показателей сходства/различия, служащих условием оценки их состоятельности и корректности применения. Так, для многих задач систематики важно, чтобы соответствующие показатели обладали свойством метрики – условие корректного применения достаточно строго определённой концепции метрического (евклидова) гиперпространства (Williams, Dale, 1965; Sneath, Sokal, 1973). Некоторые показатели таким свойством не обладают, в том числе весьма популярные: например, коэффициенты ассоциации, прямые оценки вышеупомянутой серологической и гибридологической совместимости организмов. Данное обстоятельство необходимо принимать во внимание (но это редко делается) при выборе алгоритмов иерархической кластеризации (Jardine, Sibson, 1971).
Алгоритмы и конкретные методы анализа сходства не только весьма многочисленны, но и разнородны в отношении общих принципов перехода от исходных данных к классификационной схеме. Здесь представлен их беглый обзор по разным источникам (главным образом Sneath, Sokal, 1973; Nei, Kumar, 2000; Павлинов, 2005b); несколько детальнее они и связанные с ними проблемы рассмотрены далее в разделах по численной фенетике и филетике.
Прежде всего следует указать разделение алгоритмов на таковые ординации и кластеризации, которые приблизительно соответствуют геометрической и теоретикомножественной интерпретациям сходственных отношений. Первые позволяют непосредственно исследовать распределение сравниваемых объектов в фенетическом гиперпространстве (метод главных компонент, дискриминантный анализ), вторые представляют структуру сходственных отношений в древовидной форме (фено-, фило– и кладограммы). Обычно считается, что основной задаче систематики соответствует именно вторая группа методов: результаты их применения имеют наиболее очевидную таксономическую интерпретацию и более привычны для систематиков.
По общим принципам построения деревьев эти алгоритмы могут быть точными или эвристическими: первые позволяют получить все классификации, возможные для соответствующей совокупности данных, вторые не гарантируют этого. В численной фенетике обычно используются первые, в филетике – вторые. Точные алгоритмы в силу технических ограничений могут эффективно работать с небольшими массивами данных, область приложения эвристических алгоритмов – выборки, включающие многие сотни и даже тысячи ОТЕ и единичных признаков.
Важное различие пролегает между дистантными (distance-based) и признаковыми (character-based) методами. Первые строят деревья на основе матрицы расстояний (дистанций), таковы преимущественно фенетические методы кластерного анализа. Вторые работают непосредственно на основе таксон-признаковой матрицы, это преимущественно филетические методы парсимонии и наибольшего правдоподобия.
Некоторые алгоритмы являются процедурными (procedure-based): они основаны на «локальной» оценке каждого конкретного шага построения дерева, а не на «глобальной» оценке конечного результата – итогового дерева. Таковы многие дистантные методы (прежде всего стандартный кластерный анализ) и некоторые признаковые (например, наибольшего правдоподобия). В отличие от этого, оптимизационные алгоритмы в построении дерева ориентированы на какой-либо параметр, характеризующий дерево в целом (например, общая длина дерева в методах парсимонии).
Оценка оптимальности дерева, а тем самым и основанной на нём классификации, также производится строго количественно, локально или глобально. В первом случае оценке подлежит каждый фрагмент дерева (например, в методе наибольшего правдоподобия). Во втором случае критерием оптимальности служит либо некоторое значение обобщённого параметра дерева (например, упомянутая его общая длина), либо степень соответствия структуры сходственных отношений на дереве таковой в исходной матрице дистанций (оценивается с помощью коэффициента кофенетической корреляции: Sokal, Rohlf, 1962; Сокэл, 1968; Sneath, Sokal, 1973). На этом завершающем этапе количественного анализа сходственных отношений важное значение может иметь также непосредственное количественное сравнение полученных деревьев и нахождение их некоего оптимального обобщения в форме согласованного (consensus) дерева. Методы нахождения такого дерева впервые рассмотрены в рамках численной фенетики, но в настоящее время активнее всего используются в численной филетике (см. 5.3.3).
На первых этапах развития численной систематики её сторонники довольно скептически относились к использованию вероятностных методов (Cain, Harrison, 1958; Sokal, Sneath, 1963), для чего есть свои достаточно серьёзные методологические основания (Williams, Dale, 1965). Однако в настоящее время по крайней мере численная филетика рассматривается по преимуществу как специфический подход к решению именно статистических задач (Felsenstein, 1982, 1988, 2004). Соответственно этому одной из наиболее актуальных становится проблема некой вероятностной оценки достоверности (значимости) получаемых численными методами описаний структуры таксономического разнообразия. В простейшем случае задача состоит в выяснении того, отличается ли структура разнообразия, выявленная данным методом и представленная в форме дендрограммы, от порождённой случайным образом (нуль-модель): для её решения в первом приближении применяются разного рода тесты древесности (treeness tests) (Brown, 1994). Поиск решений этой задачи может быть представлен в виде следующей совокупности вопросов (Perruchet, 1983): 1) является ли разнообразие классифицируемым, 2) как проверить существование структуры с помощью нуль-гипотезы «неклассифицируемости», 3) как проверить, является ли структура, полученная с помощью некоего алгоритма, артефактом, соответствующим чисто случайному распределению, 4) как оценить статистическую значимость полученного результата. Более содержательной и близкой к традиционному пониманию значимости результатов классифицирования является процедура проверки того, насколько хорошо то или иное дерево подкрепляется наличными данными: исходя из этой общей идеи разрабатываются индексы совместимости признаков между собой и с итоговым деревом.
Получаемые в результате применения методов численной систематики ветвящиеся графы (деревья) при определённых допущениях служат основанием для выделения в классифицируемом многообразии иерархических неперекрывающихся групп, которые могут быть оформлены в таксоны классификации. Как отмечено выше, эти деревья бывают трёх основных вариантов – фенограммы, кладограммы и филограммы. Первые две являются однопараметрическими моделями разнообразия, описывающими только включающую иерархию групп (ультраметрические деревья); филограмма – двухпараметрическая модель, в которой учтены иерархия плюс патристические дистанции (метрическое дерево) (Williams, 1967). С точки зрения содержательно значимой техники построения разница между фенограммой и кладо– и филограммой сводится к способу укоренения дерева, т. е. определения его основания, задающего высший уровень иерархии. Основание фенограммы соответствует уровню наименьшего сходства, основание кладо– или филограммы – уровню наименьшего родства между выделяемыми группами. При отождествлении общего сходства с родством здесь нет принципиальной разницы, она сводима к формальным алгоритмам. Если признаётся отсутствие взаимно-однозначного соответствия между сходством и родством, как в кладистике (см. 5.7.4.4), с точки зрения содержательной интерпретации указанная разница весьма существенна (Wiley, 1981; Павлинов, 1990а, 2005b).
Поскольку способ укоренения определяет иерархию выделяемых групп, разные способы могут давать разные классификации.
Перевод результатов анализа структуры сходственных отношений в классификацию чаще всего представляет собой интерпретацию соответствующего дерева как классификационного, при этом порядок его ветвления задаёт иерархию классификации, а его ветви разного уровня рассматриваются как таксоны разного ранга. Здесь есть свои специфические проблемы, решаемые по-разному в фенетике и в филетике; впрочем, они не всегда являются строго численными по способам решения.
Области приложения методов численной систематики зависят от двух основных факторов: (а) насколько представимы характеристики сравниваемых организмов в качестве формализованных признаков и (б) насколько сопоставимы (гомологичны) эти признаки. По вполне понятным причинам порождаемые ими проблемы и трудности наиболее актуальны при работе со сложными морфологическими макроструктурами и сводятся к минимуму при работе с биохимическими характеристиками. В общем случае эффективность численных методов снижается по мере увеличения сложности организмов и степени различий между ними: по морфологии адекватно (полноценно) сравнить цветковое растение и позвоночное животное сложнее, чем эу– и архебактерий. Для наиболее сложно устроенных организмов при работе с морфологическими признаками численные методы наиболее применимы на низших таксономических уровнях, где указанные факторы наименее актуальны; поэтому они активнее всего используются в популяционной систематике. Большая простота молекулярных структур сравнении с макроморфологическими позволяет почти одинаково эффективно работать на всех таксономических уровнях вплоть до самых высоких: на этом основаны современные реконструкции молекулярного «дерева жизни» средствами главным образом численной филетики (Cracraft, Donoghue, 2004).
Характер многих методов численной систематики таков, что позволяет одинаково эффективно исследовать как собственно таксоны (ОТЕ), так и признаки: эти способы анализа обозначают соответственно как методы Q- и R-анализа (Sneath, Sokal, 1973), они соответствуют таксономическому и мерономическому исследованию по Мейену (1978). Во втором случае первоначально решались задачи на выявление признаков, определяющих межтаксонные различия, с помощью фишеровских методов дисперсионного и дискриминантного анализа. Формально это можно рассматривать как некую процедуру апостериорного количественного взвешивания признаков, по сути же это – способ составления диагнозов соответствующих таксонов. Сходным образом, но на другой методической основе, численная филетика позволяет выявлять синапоморфии, характеризующие (диагностирующие) монофилетические группы. С помощью корреляционного, кластерного и компонентного методов анализа можно выявлять группы взаимосвязанных признаков (корреляционные плеяды по П.В. Терентьеву, см.: Ростова, 2002) и редуцировать признаковое пространство за счёт использования только немногих признаков-индикаторов этих «плеяд» (Смирнов, 1938): это также является одним из методов взвешивания признаков. Нечто подобное применяется при выяснении операционной гомологии признаков на основе фенетических приближений (см. 5.2.2.2). Наконец, средствами численной филетики можно исследовать таксон-признаковое соответствие (о нём см. 6.3.1), рассматривая распределения значений признаков на классификационных деревьях.
С некоторыми оговорками к области исследований численной систематики в широком понимании допустимо относить задачи не только на построение классификации, но и на исследование их структуры, так или иначе характеризуемой количественными параметрами. Здесь особого упоминания заслуживает фундаментальное для систематики ранговое распределение Ципфа-Мандельброта, описывающее количественную закономерность определённого соотношения между числом и объёмом таксонов в надтаксоне следующего более высокого ранга – видов в родах, родов в семействах и т. п. (Численко, 1977; Мейен, 1978; Kafanov, Sukhanov, 1995; см. 6.2).
В настоящее время, если судить по числу публикаций, исследования по систематике с применением количественных методов весьма многочисленны, так что отмеченные выше оптимистические прогнозы можно считать частью сбывшимися. Правда, среди этих исследований ныне преобладают не фенетические, а филетические методы, что связано с особой популярностью молекулярной филогенетики.
Те свойства подходов и методов численной систематики, которые её сторонники рассматривают как достоинства (см. 5.3.1), её противники считают по вполне понятным причинам недостатками. Критику в её адрес можно кратко суммировать следующим образом.
В первую очередь следует подчеркнуть общие возражения против формализованного, строгого и «объективного» характера численной систематики как её основных якобы достоинств. Формализованность и связанная с ней строгость означают максимальный разрыв между описываемым природным объектом и языком описания: они ведут к крайнему упрощению этого языка по сравнению со сложным объектом. В итоге создаётся лишь видимость того, что строгое формализованное описание (классификация) адекватно таксономической реальности. На самом деле адекватность может быть очень низкой: «в той степени, в какой предложения математики относятся к действительности, они не надёжны, в той степени, в какой они надёжны, они не относятся к действительности» (А. Эйнштейн; цит. по: Фоллмер, 1998, с. 28). В связи с этим, оставаясь в рамках строго нумерических приближений, вполне бессмысленно применять к оценке результатов их приложения категории истинности в её реалистической трактовке: полученная формальным способом «классификация… <просто> основана на ряде правил и по этой причине о ней нельзя говорить, что она истинна или ложна (как мы говорим о теории)» (Рьюз, 1977, с. 231). С этой точки зрения нумеризация систематики едва ли существенно увеличивает содержательное знание о таксономическом разнообразии, в большой степени производит информационный шум (Баранцев, 1989).
На ошибочность тезиса о пресловутой объективности численной систематики и разрабатываемых ею классификаций обращают внимание многие авторы (Williams, Dale, 1965; Ghiselin, 1966; Баранцев, 1989; Расницын, 2002). Это качество обосновывается позитивистским тезисом нейтральности метода (в широком смысле) относительно как априорных суждений содержательного толка, так и личных предпочтений исследователя (Sokal, Sneath, 1963). С одной стороны, как видно из предыдущего, «нейтральность» такого метода может делать получаемые с его помощью классификации вполне «нейтральными» относительно исследуемой таксономической реальности так, что вопрос об «объективности» отпадает сам собой. Данное обстоятельство специально рассматривается принципом соответствия (см. далее наст, раздел). С другой стороны, необходимость выбора какого-то одного метода из множества возможных вводит в познавательную ситуацию, в которой функционирует численная систематика, субъективный фактор – личностное знание, стиль мышления (см. 6.1.1). Поэтому получаемые её средствами классификации «не объективны, поскольку зависят от персонального выбора» метода (Williams, Dale, 1965, р. 45); скорее, речь должна идти об интерсубъективности в смысле Гуссерля (см. Стёпин, 2003). Если идти ещё глубже, в обоснование самих методов, то здесь мы упираемся в то же самое – в субъективный характер выбора начальных формализмов (Френкель, Бар-Хиллел, 1966; см. 5.5.2.3)
Тезис об эмпирическом характере численной систематики едва ли соответствует действительности. Прежде всего следует обратить внимание на то, что акцент на методах делает весь этот подход скорее рациональным, чем эмпирическим; впрочем, этот вопрос сугубо «философический» (см. 4.1). Важно другое: исследования с использованием математического аппарата основаны на анализе не натурных объектов как таковых, а их идеальных моделей, представленных в формулах некими переменными. В этой операции идеации (см. 7.1) сам объект исчезает – ас ним исчезает и эмпиризм с эмпирически понимаемой объективностью, т. е. нацеленностью на объект как таковой. Как «идеальное чёрное тело» в физике, так и «центроид выборки» в численной систематике представляют собой ни что иное как некое подобие платоновских идей (Любищев, 1968, 1982) – точнее, не самих этих идей, а скорее их специфических репрезентаций.
Точность каждого из методов численной систематики задана лишь в рамках некоторого набора формализаций, служащих обоснованием именно данного метода, и может быть не определена для других формализаций (Williams, Dale, 1965; Шаталкин, 1983а). Это порождает неустранимое многообразие количественных методов, каждый из которых может быть хорош сам по себе в рамках неких частных исходных допущений, но которые принципиально несводимы друг к другу или к какому-то особому «суперметоду» (Шаталкин, 1983а; Williams, Ebach, 2005). Данное обстоятельство отмечают и сами разработчики численной систематики, указывая, что «нет единого метода группировки, одинаково пригодного во всех случаях» (Сокэл, 1968, с. 307; также Sneath, 1995).
Повторимость, как одно из проявлений точности, является следствием применения стереотипного метода для решения стереотипной задачи на стереотипно организованном материале и потому ведёт лишь к стереотипным (тривиальным) результатам. Разумеется, следование этому критерию можно рассматривать как приемлемый путь достижения устойчивых классификаций, значимых с пользовательской точки зрения (Чайковский, 2003, 2007). Но с теоретической точки зрения в систематике гораздо интересней и важнее, когда стандартный метод не срабатывает, давая слабое соответствие результатов исходным данным. Это может служить показателем того, что исследователь имеет дело с существенно нестереотипной структурой разнообразия, требующей нетривиального осмысления и нетривиальных методов исследования (Кафанов и др., 2004).
Многообразие методов численной систематики, дающих разные частные классификации, порождает специфическую таксономическую неопределённость (Sneath, Sokal, 1973): совокупный результат применения разных точных методов к одним и тем же данным оказывается весьма нечётким и допускающим разные таксономические решения. Всё это достаточно далеко от той однозначности, на которую рассчитывают неискушённые в методологических тонкостях пользователи, привлечённые лозунгами «нумеристов».
Это многообразие порождает серьёзную методологическую проблему обоснованного выбора метода, частью которой является проблема определения основания этого выбора. Центральным пунктом здесь является определение критериев состоятельности метода – грубо говоря, определения того, какой из методов «более правильный», дающую «более правильную» классификацию. Сторонники математической систематики основным критерием считают надёжную обоснованность метода математической теорией. Как только что было подчёркнуто, подобное обоснование делает каждый метод состоятельным («правильным») только относительно своих собственных исходных формализаций (Williams, Dale, 1965). Такого рода ориентация численной систематики на метод (в широком смысле) как таковой ввергает её в фундаментальную проблему инструментализма (Rieppel, 2007а): качество классификации определяется не через её соответствие той структуре разнообразия, которую она призвана отразить (условие реализма), но через формально обосновываемое качество самого метода (условие инструментализма).
С биологической (содержательной) точки зрения этого явно недостаточно: «применительно к естественным наукам всякий математический метод имеет смысл не сам по себе, а в связи с той целью, для которой он используется» (Шаталкин, 1983а, с. 52). Это означает, что состоятельность (качество) метода определяется его возможностью эффективно решать биологически осмысленные задачи: в некотором смысле правы те, кто считает, что «окончательный тест количественного метода – его оценка пользователем как полезного» (Williams, Dale, 1965, р. 48), т. е. эффективного в только что указанном смысле. Снит и Сокэл (Sneath, Sokal, 1973) считают, что метод тем более состоятелен, чем больше соответствие получаемой с его помощью классификации (а) критерию естественности по Джилмуру (внешний критерий; о нём см. 5.5.2.2) и/ или (б) структуре исходных данных (внутренний критерий). Важно подчеркнуть, что коль скоро осмысленность самой задачи таксономического исследования определяется на основании некоторой базовой содержательной теории (предпосылочного знания), то от последней в той или иной мере зависит и состоятельность способа её решения, начиная от частного определения сходства (Tversky, 1977; Sober, 1984; Павлинов, 2007а) и кончая алгоритмом перехода от сходства к классификации. На этом основании вводится принцип соответствия (не путать с одноимённым боровским, см. 1), согласно которому метод не может быть строго «нейтральным» относительно базовой содержательной теории (Павлинов, 1992а, 1996, 2007а; см. 6.1.2). Поэтому некорректно противопоставление, что «систематик должен судить о методе на основании не каких-то своих априорных суждений, но полезности результатов» (Dunn, Everitt, 2004, р. 6): очевидно, что «полезность результатов» может быть оценена только с точки зрения условий решения той содержательной задачи, которая ставится именно на основании «априорных суждений».
В своём крайнем проявлении «антиматематизм» присущ систематикам-интуитивистам, которые в принципе не приемлют формализаций, по необходимости сопутствующих количественным методам. Они лишают систематику творческого начала, превращая её в только что упомянутую стандартную рутинную процедуру поиска стандартных рутинных решений для стандартным образом подобранных данных, руководствуясь не собственными опытом и интуицией, а кем-то написанными компьютерными программами. «Для многих современных (в основном, но не исключительно молодых) сотрудников „рецепт“ научного роста выглядит очень просто: заложить данные в компьютер, применить новейшую программу, нажать кнопку – и ждать Нобелевской премии» (Holynski, 2005, р. 487). Такую науку Н. Элдридж справедливо называет поверхностной (slick) (Eldredge, 1989). Едва ли случайно в сводке систематика-традиционалиста Р. Блэкуелдера, как отмечено выше, названные методы фактически проигнорированы (Blackwelder, 1967). Позицию «традиционалистов» в отношении численной систематики выразил довольно жёсткой оценкой И. Коробков (1971), утверждая, что «нумерической систематики, которая коренным образом изменила бы систему животных и растительных организмов, нет и конечно не будет» (с. 40).
Особую критику со стороны интуитивистов вызывает формальный характер выделения и анализа признаков (а иногда и само формальное понятие признака), не связанный с их внимательным содержательным анализом вообще (Wheeler, 2008b; Mooi, Gill, 2010) и функционально-адаптивной оценкой в частности (Юдин, 1974; Gutmann, 1976). Здесь важную проблему, упоминаемую, но неохотно обсуждаемую сторонниками численной систематики, составляет анализ межпризнаковых связей. В большинстве методов признаки рассматриваются как взаимно независимые. Это, с одной стороны, вызывает категорические возражения приверженцев холистической онтологии, для которых организм есть «целое в индивидуальном и историческом развитии» и потому на отдельные признаки целиком не разложим. С другой стороны, включение скоррелированных признаков в количественный анализ как независимых может влечь за собой нежелательное дублирование информации и избыточную поддержку получаемых классификаций. Формальным решением здесь служит вышеупомянутый метод корреляционных плеяд; однако с содержательной точки зрения он едва ли состоятелен, поскольку не различает разные типы скоррелированности признаков, среди которых есть и чисто статистические, и биологические.
Более мягкая критика адресована не самим численным методам, а преувеличению их значения в биологической систематике. Так, в вводном разделе к одному из первых руководств по количественным методам в зоологии его авторы пишут, что «зоолог… несомненно не должен быть заинтересован в редукции своих наблюдений или теорий к строго количественной основе, просто потому что ему нравятся цифры. Его интерес совсем не в формулах или числах, но в животных» (Simpson, Roe, 1939, р. vii-viii). Указывается, что всякий количественный метод просто реорганизует исходные данные, привнося в них минимум нового содержания, поэтому систематик, ориентированный на изучение реальных биологических объектов, не должен использовать особо изощрённые методы, якобы повышающие точность, если доступны простые (Hagen, 2003). Примечательно, что Дж. Джилмур, один из первых и ведущих идеологов позитивистской концепции систематики середины XX столетия (см. 5.5.2.2), указывал на то, что увлечение количественными методами может приводить к иллюзии, что результатами численной систематики исследование кончается: на самом деле оно только начинается (Gilmour, 1961). Всякие схемы, полученные на количественной основе, – лишь абстракции и должны внимательно оцениваться биологически, прежде чем их класть в основу таксономических заключений (Moss, Hendrickson, 1973).
Специализация численной систематики в разработке количественных методов, вполне закономерная с точки зрения куновской модели развития науки, неибежно превратила её в уже упоминавшуюся математическую таксономию, оперирующую исключительно «математизмами» и весьма далёкую от биологической проблематики (Jardine, Sibson, 1971; Dunn, Everitt, 1982). Это сделало более чем актуальной для данного направления вышеупомянутую проблему инструментализма, обязывающего оценивать качество полученной классификации по её соответствию условиям метода классифицирования, а не исследуемой таксономической реальности (Williams, Dale, 1965; Rieppel, 2007а). Подобное развитие численной систематики сводит поиски ответов на биологически осмысленные вопросы к уровню применимости формальных методов и тем самым в значительной мере лишает как сами эти вопросы, так и ответы на них содержательности. В таком формализованном контексте оказываются принципиально неразрешимыми противоречия, вызванные множественностью количественных методов: оказалось, что выбор методов слишком неочевиден для того, чтобы рассчитывать на получение искомой единственной «объективной» классификации (Williams, Dale, 1965; Шаталкин, 1983а; см. 5.3.1). Это стало одной из причин снижения интереса к численной систематике, по крайней мере к её фенетическому разделу.
Таким образом, современное состояние численной систематики порождает больше проблем, чем решает, причём проблемы оказываются весьма фундаментальными, затрагивающими самые основания этого раздела систематики как естественнонаучной дисциплины. Одна из ключевых причин ныне осознаваемой проблемности – смена эпистемологической научной парадигмы, переход от позитивистской к неклассической концепции естественных наук, где по-иному расставлены акценты в понимании структуры познавательной ситуации и состоятельности получаемого в ней знания (см. 1.2.1, 6.1.1). Те простые решения, которые предложила численная систематика, оказались едва ли адекватными сложности общей проблемы понимания и описания структуры таксономической реальности. Соответственно в настоящее время наиболее актуальная задача – осознать эту неадекватность, чтобы оценить результаты и возможные перспективы «нумеризации» систематики как биологической дисциплины.
Внимание! Это не конец книги.
Если начало книги вам понравилось, то полную версию можно приобрести у нашего партнёра - распространителя легального контента. Поддержите автора!Правообладателям!
Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.Читателям!
Оплатили, но не знаете что делать дальше?