СТАНОВЛЕНИЕ ТЕОРЕТИКО-ИГРОВОГО МОДЕЛИРОВАНИЯ ЭВОЛЮЦИИ

Э. Ф. Караваев

Санкт-Петербургский государственный университет

Санкт-Петербург, Россия; EK1549@ek1549.spb. edu

Статья посвящена рассмотрению исторических и методологических вопросов становления теоретико-игрового моделирования эволюции. Еще в 1930 г., когда Р. Фишер исследовал проблему устойчивости соотношения полов, он использовал, фактически, теоретико-игровые идеи и подошел достаточно близко к понятию эво — люционно устойчивой стратегии (ЭСС). Это же можно сказать и о работах других исследователей (например, К. Левонтин, У. Гамильтон). Следует отметить также, что никто из них не мог ознакомиться с некоторыми ценными идеями, сформули — рованными Джоном Нэшом в 1949 г. в его диссертации, так как они были опубли — кованы только через 25 лет. В 1973 г. Дж. Прайс и Дж. Мейнард Смит опублико — вали статью, которая, как оказалось впоследствии, была настоящим прорывом в новую область. В 1982 г. Мейнард Смит опубликовал книгу «Эволюция и теория игр». В статье далее приводятся типовые примеры игр. Даются также некоторые разъяснения понятия ЭСС.

Ключевые слова: эволюция, популяция, индивид, приспособленность, моделирова — ние, теория игр, эволюционно стабильная стратегия.

Уже в 1930 г. — в начале развития того научного направления, которое сейчас носит название «современный эволюционный синтез» (Колчинский, 2006), — ан — глийский ученый Р. А. Фишер, выдающийся математик-статистик1 и вместе с тем биолог-эволюционист и генетик,2 в книге «Генетическая теория естественного отбо — ра» (Fisher, 1930), фактически, использовал теоретико-игровые идеи в построении математической модели естественного отбора. В главе VI «Воспроизводство полов и соотношение полов» Фишером было положено начало работам по исследованию эволюции соотношения полов. Проблема, с которой он столкнулся, состояла в сле- дующем: почему-то соотношение полов является приблизительно равным у таких многих видов, в популяциях которых большинство самцов никогда не спариваются с самками. Эти самцы представляются, на первый взгляд, излишним, не принося — щим реальной пользы «грузом», который ложится на остальных индивидов данной популяции. Фишер пришел к заключению, что если измерять приспособленность

1 Фишер Рональд Эйльмер (1890–1962), в частности, ввел важное понятие «достаточной статистики», построил теорию точечных и интервальных статистических оценок, разработал методику планирования экспериментов и внес существенный вклад в создание теории стати — стической проверки гипотез (Математический энциклопедический словарь, 1988).

2 Эрнст Майр — один из «главных архитекторов» современного эволюционного оказалось впоследствии, была настоящим прорывом в новую область. В 1982 г. Мейнард Смит опубликовал книгу «Эволюция и теория игр». В статье далее приводятся типовые примеры игр. Даются также некоторые разъяснения понятия ЭСС.

Ключевые слова: эволюция, популяция, индивид, приспособленность, моделирова — ние, теория игр, эволюционно стабильная стратегия.

Уже в 1930 г. — в начале развития того научного направления, которое сейчас носит название «современный эволюционный синтез» (Колчинский, 2006), — ан — глийский ученый Р. А. Фишер, выдающийся математик-статистик1 и вместе с тем биолог-эволюционист и генетик,2 в книге «Генетическая теория естественного отбо — ра» (Fisher, 1930), фактически, использовал теоретико-игровые идеи в построении математической модели естественного отбора. В главе VI «Воспроизводство полов и соотношение полов» Фишером было положено начало работам по исследованию эволюции соотношения полов. Проблема, с которой он столкнулся, состояла в сле- дующем: почему-то соотношение полов является приблизительно равным у таких многих видов, в популяциях которых большинство самцов никогда не спариваются с самками. Эти самцы представляются, на первый взгляд, излишним, не принося — щим реальной пользы «грузом», который ложится на остальных индивидов данной популяции. Фишер пришел к заключению, что если измерять приспособленность

1 Фишер Рональд Эйльмер (1890–1962), в частности, ввел важное понятие «достаточной статистики», построил теорию точечных и интервальных статистических оценок, разработал методику планирования экспериментов и внес существенный вклад в создание теории стати — стической проверки гипотез (Математический энциклопедический словарь, 1988).

2 Эрнст Майр — один из «главных архитекторов» современного эволюционного синтеза

(Колчинский, 2006) — уже после достаточно жарких дискуссий писал в своей работе 1970 г.:

«Современная позиция по отношению к естественному отбору имеет два корня. Один — ма-тематический анализ (Фишер, Холдейн, Сьюэл Райт и др.), убедительно показавший, что

даже чрезвычайно малые селективные преимущества в конце концов ведут к накоплению

в популяции генов, определяющих эти преимущества» (Майр, 1974, с. 123). Книга Фише-ра «Генетическая теория естественного отбора» теперь заслуженно считается классической

в области эволюционной биологии и неоднократно переиздавалась — в 1958, 1999, 2003 г.

индивида посредством ожидаемого количества «внуков», то есть индивидов третье — го поколения, то эта приспособленность зависит от распределения в данной попу — ляции индивидов мужского и женского рода. Если число женских особей больше, то мужские особи обладают более высокой индивидуальной приспособленностью. А если в популяции больше мужских особей, то женские особи обладают более вы — сокой индивидуальной приспособленностью. При таком положении дел, как пока — зал Фишер, эволюционная динамика приводит к тому, что соотношение полов ста- новится зафиксированным на равном количестве мужских и женских особей. Этот факт, состоящий в том, что приспособленность индивида зависит от относительной частоты в популяции мужских и женских особей, вводит в рассмотрение эволюции стратегический, в сугубо теоретико-игровом смысле, элемент.

В самом деле, согласно Фишеру, для видов, выращивающих свое потомство, третичное соотношение полов 1 : 1 является оптимальным и обеспечивает наилуч — шие условия для его выживания3.

Итак, заслуга Фишера перед биологической наукой состоит в предвосхs’> или женского пола до завершения воспитания потомства. Так что чем «до — роже обходятся» родителям потомки данного пола, тем их меньше производится. Из этой

«гипотезы равных затрат» вытекает, в частности, что в тех случаях, когда потомки разного пола имеют разные размеры, должно наблюдаться нарушение соотношения полов. Однако это не согласуется с опытными данными ряда ученых, относящимися к птицам (вороньи дрозды, ястребы), ко многим видам клещей и насекомых. Наиболее принятой в настоящее время является концепция Джона Мейнарда Смита (Мейнард Смит, 1981), который предпо — ложил, что «для родителей, возможно, „выгоднее“ производить потомство пола, более редко встречающегося в данной местности».

неопределенности в ожидания игроков. Подобного рода приемы, считает Фишер, следует ввести в реакции «естественных врагов» в представлении того или иного состояния природы.

Затем он напоминает, что десять лет спустя Дж. фон Нейман и О. Моргенштерн опубликовали фундаментальную работу «Теория игр и экономическое поведение», в которой был сформулирован общий принцип минимакса (Neumann, Morgenstern,

2007), и добавляет: «к которому, на самом деле, фон Нейман еще раньше привлекал внимание в одном из немецких математических журналов» (Fisher, 1958, p. 292)4.

Заметим, то, что предложил Фишер, еще не было эволюционной теорией игр.

«Игроками» у него были виды, а не индивиды. Такого же рода предположения при — держивался и Ричард Левонтин, который рассматривал «популяции, играющие про — тив природы», беря в качестве выигрыша выживание видов и «страхование их шан — сов» в ситуациях, когда события развиваются по сценариям, включающим в себя наихудшие случаи (Lewontin, 1961). В обоих рассмотренных подходах — и у Фишера, и у Левонтина — все еще отсутствовал один существенный момент: сочетание локаль — ной конкуренции внутри некоторой популяции с тем фактом, что успешность страте — гии зависит от частоты ее распространения среди индивидов популяции.

Первым, кто осознанно ориентировался на теорию игр в моделировании вну — тривидовой конкуренции и оценок приспособленности, зависящей от соотношения частот стратегий, был Уильям Д. Гамильтон. С книгой фон Неймана и Морген — штерна он познакомился, когда, будучи студентом, изучал генетику, а вернулся к ней, когда работал над магистерской диссертацией по демографии в Лондонской школе экономики. Позднее он вспоминал, что именно тогда сообразил, что понятие приспособленности можно рассматривать в качестве «биологического эквивалента

„выигрыша“ в теории игр» (Hamilton, 1996). Гамильтон был знаком и с пользующей — ся заслуженным авторитетом книгой Р. Данкена Льюса и Говарда Райфы, в кото- рой хорошо освещено понятие «равновесия Нэша» и дано подробное рассмотрение

«дилеммы заключенного» (Luce, Raiffa, 1957). В концепции Гамильтона необычных соотношений полов (Hamilton, 1967) рассматривается, фактически, и «игра инди- вида с популяцией» и попарно организованная конкуренция (внутри одного и того же организма-«хозяина» двух других особых организмов — паразитоидов, которые его постепенно поедают). И главное, что отмечено опять-таки Мейнардом Смитом (Maynard Smith, 1982, р. 23, 43), он вплотную подошел к понятию «эволюционно устойчивой стратегии»; правда, она у Гамильтона называется «непревосходимой» (unbeatable).

В 1949 г. в докторской диссертации «Некооперативные игры» в разделе «Моти — вация и интерпретация» Джон Нэш писал:

«Теперь мы попытаемся рассмотреть интерпретацию точек равновесия, осно — ванную на понятии соотношения „масса–действие“. В этой интерпретации характер решений не имеет большого значения. Необязательно требуется предполагать, что участники игры обладают полным знанием всей структуры игры или способностью

4 Фактически, фон Нейман уже в 1928 г. доказал теорему о минимаксе. Рассматриваемые нами книга Фишера «Генетическая теория естественного отбора» и статья «Полиморфизм и естественный отбор» были написаны им, когда он еще не был знаком с результатами, полученными фон Нейманом. По-видимому, он не был знаком и с работами по теории игр

1920-х гг. Э. Бореля.

тщательно пункт за пунктом разбирать сложные процессы рассуждений. Однако предполагается, что участники аккумулируют информацию, полученную из опыта и касающуюся сопоставления одних с другими преимуществ, предоставляемых раз- личными стратегиями, находящимися в их распоряжении.

Более подробно мы предполагаем, что для каждой позиции в игре имеется не — которая популяция (в смысле статистики) участников. Будем предполагать также, что в «среднее исполнение» игры вовлечено n участников, выбранных случайным образом из популяций, и что существует некоторая стабильная средняя частота, с которой каждая чистая стратегия применяется «средним количеством» участни — ков из определенной популяции». (Nash, 2002, р. 78)

Далее следуют соответствующие технические выкладки, а затем Нэш делает следующее заключение:

«Таким образом, те допущения, которые мы сделали в этой интерпретации, основанной на понятии соотношения „масса–действие“, приводят нас к заключе — нию о том, что смешанные стратегии, репрезентирующие среднее поведение в каж — дой из популяций, образуют некоторую точку равновесия» (Nash, 2002, p. 79).

Так что можно только присоединиться к сожалению Карла Зигмунда (Sigmund,

2005) о том, что эта часть диссертации Нэша не была в свое время опубликована.

А была она опубликована только в середине 1990-х гг. Так что ни Фишер, ни Ле-вонтин, ни Гамильтон не получили должного «импульса» к открытию и формули-рованию понятия «эволюционно стабильной стратегии», который, как это видно из

приведенного отрывка из диссертации Нэша, они могли бы получить.

В 1970 г. несколько чудаковатый ученый американец Джордж Прайс предста-вил в журнал “Nature” статью. В ней предлагалось объяснение того, как животные,

используя некоторую стратегию поведения — «отвечать тем же самым образом»,

могли бы иметь преимущество, с точки зрения отбора во внутривидовых столкнове-ниях. Это позволяло понять, не обращаясь то и дело к идее группового отбора, ши-рокое распространение во взаимоотношениях животных форм поведения, подоб-ных ритуалам. Мейнард Смит быстро понял и оценил достоинства такого подхода.

Однако он не мог рекомендовать статью Прайса к опубликованию из-за того, что

она была слишком длинной. В процессе доработки появилась их совместная ста-тья «Логика конфликта среди животных» (Maynard Smith, Price, 1973). Три аспекта

этой работы оказались новыми и плодотворными. Во-первых, появилось само по-нятие «эволюционно стабильная стратегия», в котором соединились теория игр и

популяционная динамика. Во-вторых, был применен метод моделирования с помо-щью компьютера. И, в-третьих, возможно, самое главное — теория игр была приме-нена к анализу взаимоотношений между животными или, рассуждая более общим

способом, необязательно к игрокам, которые действуют, опираясь на разум. Далее

обнаружилось, что понятие «эволюционно стабильная стратегия» является одним

из уточнений понятия «равновесие Нэша» и оно отражает динамику возможного

вторжения в популяцию индивидов, использующих свою стратегию.

Несомненно, самый значительный вклад в теоретико-игровое моделирование

эволюции был сделан в книге Мейнарда Смита «Эволюция и теория игр» (Maynard

Smith, 1982). Незадолго до этого прошла достаточно бурная дискуссия, предметом ко-торой были попытки Веро Вини-Эдвардса объяснить наличие некоторых признаков,

связанных с адаптацией популяций (неравное соотношение полов, уменьшение ин-тенсивности размножения, увеличение продолжительности жизни поколения и др.),

действием группового отбора. Эрнст Майр резко возражал против того, чтобы рас — сматривать в качестве единицы отбора не индивида, а популяцию, семью или стадо, что, заметим, соответствовало позиции самого Дарвина (Колчинский, 2006, c. 70). И вот Мейнард Смит ввел понятие «эволюционно стабильной стратегии».

«Ходы», из последовательности которых складывается какая-то игровая страте — гия, производятся индивидами по определенным правилам. Опишем некоторые из них. Игра «Ястреб–голубь» описывается посредством такой матрицы:

Hawk

Dove

Hawk

½(V-C)

½(V-C)

V

0

Dove

0

V

V/2

V/2

Два индивида: «Ястреб (Hawk)» и «Голубь (Dove)» — состязаются в борьбе за ре — сурс фиксированной величины V. В данном, биологическом, контексте этот ресурс со — ответствует тому увеличению приспособленности индивида, которое он приобретает, если получает этот ресурс. Каждый индивид следует одной из двух линий поведения:

Ястреб инициирует агрессивное поведение и не прекращает его, пока соперник не отступит. Голубь сразу же отступает, как только его соперник проявляет агрессию.

Из матрицы, описывающей игру, можно видеть, что когда оба ее участника про — являют агрессию, у них обоих приспособленность изменяется на величину ½(V-C), где С — плата за участие в конфликте. Когда Ястреб встречается с Голубем, он полу — чает весь ресурс, а Голубь не получает ничего. Когда встречаются два Голубя, то они поровну делят ресурс, и каждый увеличивает свою приспособленность на V/2.

Второй пример — так называемая «дилемма заключенного»: Солидаризирую — щийся (Cooperate) игрок проявляет доброжелательность в расчете на взаимность (или даже не задумывается об этом), а Порочный (Defect) думает только о соб — ственной выгоде. Когда оба участника игры проявляют солидарность, они полу — чают (равное) вознаграждение. Солидаризирующийся при встрече с Порочным проигрывает, а тот получает выигрыш больший, нежели в том случае, если бы и он проявил солидарность. При встрече Порочного с Порочным выигрыш получают оба, и притом одинаковый, но меньше того выигрыша, который получают при встрече друг с другом двое Солидаризирующихся.

Cooperate

Defect

Cooperate

3

3

0

5

Defect

0

5

1

1

Введем обозначения: σ и μ — стратегии; F0 — первоначальная приспособленность

индивида; ΔF(s1, s2) — изменение в приспособленности индивида, который следует

стратегии s1 вместо s2; р — доля индивидов, следующих стратегии μ. Тогда условия

того, что стратегия будет эволюционно стабильной стратегией, определяются так:

F(σ) = F0 + (1 – p) ΔF(σ, σ) + p ΔF(σ, μ)

F(μ) = F0 + (1 – p) ΔF(μ, σ) + p ΔF(μ, μ).

Должно иметь место: F(σ) > F(μ). С учетом того, что в начале процесса р —

только небольшая доля популяции и что μ ≠ σ:

ΔF(σ, σ) > ΔF(μ, σ) или

[(ΔF(σ, σ) = ΔF(μ, σ)) & (ΔF(σ, μ) > ΔF(μ, σ))].

Из рассмотрения первого примера можно увидеть, что стратегия Голубя не яв-ляется эволюционно стабильной: мутант, использующий стратегию Ястреба, может

внедриться в популяцию. Если величина V больше, чем плата за участие в конфликте

С, то стратегия Ястреба является эволюционно устойчивой. А в случае, когда V мень-ше, чем С, вообще нет эволюционно устойчивой стратегии, если не использовать сме-шанную стратегию, то есть некоторое сочетание стратегий Ястреба и Голубя.

Из рассмотрения второго примера можно увидеть, что стратегия Солидаризи-рующегося не является эволюционно устойчивой, а стратегия Порочного являет-ся. И опять-таки можно найти смешанную стратегию, которая будет эволюционно

устойчивой.

Интерес представляет еще одна стратегия: она состоит в том, что участник игры

в первом своем ходе действует как Солидаризирующийся, а далее — так, как вел

себя другой участник в предыдущем ходе. Игрока с такой стратегией можно назвать

«Равноценно отвечающим» (Tit for tat). Пусть в данной популяции ее часть из р ин-дивидов придерживается стратегии Равноценно отвечающего; соответственно, 1-р

есть та ее часть, которая придерживается стратегии Порочного. Пусть, далее, общее

число ходов равно N. После первого хода Равноценно отвечающий не получает ни-чего, а Порочный — 5. В последующем и тот и другой будут получать по 1, и после

N ходов баланс будет таким: у Равноценно отвечающего всего 1×0 + (N-1)×1 = N-1,

т. е. 1-1/N т. е. при достаточно большом N почти столько же, сколько у Порочного.

Теперь можно построить матрицу для повторяющейся игры из N ходов:

Tit for tat

Cooperate

Defect

Tit for tat

3

3

3

3

1+4/N

1-1/N

Cooperate

3

3

3

3

5

0

Defect

1-1/N

1+4/N

0

5

1

1

Нетрудно увидеть в правом нижнем углу «встроенную» исходную матрицу для

«дилеммы заключенного». Так что пренебрегая членами порядка 1/N и ограничива — ясь стратегиями Равноценно отвечающего и Порочного, мы получаем матрицу, кото — рая показывает нам, что вполне возможна кооперация индивидов: ведь точно так же, как в исходной матрице доминировала и была эволюционно устойчивой стратегия Порочного, теперь стратегия Равноценно отвечающего доминирует над стратегией Порочного. Таким образом, кооперация может быть рационально подкреплена.

3

3

3

3

5

0

Defect

1-1/N

1+4/N

0

5

1

1

Нетрудно увидеть в правом нижнем углу «встроенную» исходную матрицу для

«дилеммы заключенного». Так что пренебрегая членами порядка 1/N и ограничива — ясь стратегиями Равноценно отвечающего и Порочного, мы получаем матрицу, кото — рая показывает нам, что вполне возможна кооперация индивидов: ведь точно так же, как в исходной матрице доминировала и была эволюционно устойчивой стратегия Порочного, теперь стратегия Равноценно отвечающего доминирует над стратегией Порочного. Таким образом, кооперация может быть рационально подкреплена.

В заключение можно предположить, что эволюционная теория игр лучше при — способлена к тому, чтобы придать именно ей форму «обобщенной теории игр», которая предназначена для того, чтобы более адекватно отразить особенности социально-гуманитарных явлений, в частности их социально-психологических аспектов, связанных с функционированием норм. Эта теория есть теория правил и комплексов правил, а построение стратегии оказывается аналогом логического вы — вода (Burns, Roszkowska, 2005). И тогда в построении модели эволюции и ее «дере — ва» стратегий можно шире использовать достижения современной неклассической логики (Караваев, 2008).

Литература

Караваев Э. Ф. Средства неклассической логики в формализации процедур планирования деятельности // Вестник СПбГУ. 2008. Сер. 6. Вып. 1. С. 87–94.

Колчинский Э. И. Эрнст Майр и современный эволюционный синтез. М. : Т-во науч. изд.

КМК, 2006. 152 c.

Майр Э. Популяция, виды и эволюция. М. : Мир, 1974. 464 с.

Математический энциклопедический словарь / гл. ред. Ю. В. Прохоров. М. : Сов. энцикло — педия, 1988. 847 с.

Мейнард Смит Дж. Эволюция полового размножения. М. : Мир, 1981. 271с.

Burns T., Roszkowska E. Generalized Game Theory: Assumptions, Principles, and Elaborations // Stud — ies in Logic, Grammar, and Rhetoric Grounded in Social Theory. 2005. Vol. 8. № 21. P. 7–34.

Fisher R. A. The Genetic Theory of Natural Selection. Oxford : Clarendon Press, 1930. XIV + 280 p.

Fisher R. A. Polymorphism and natural selection // Journal of Ecology. 1958. Vol. 46. № 2.

P. 289–293.

Hamilton W. D. Extraordinary sex ratios // Science. 1967. Vol. 156. № 3774. P. 477–488.

Hamilton W. D. Narrow Roads to Gene Land. Vol. 1. Evolution of Social Behaviour. Oxford : Oxford

Univ. Press ; N. Y. : Freeman, 1996. 568 p.

Lewontin R. C. Evolution and the theory of games // Journal of Theoretical Biology. 1961. Vol. 4.

№ 1. P. 382–403.

Luce R. D., Raiffa H. Games and Decisions: Introduction and Critical Survey. New York : John Wi-ley & критический обзор. М. : Изд-во иностр. лит., 1961. 643 с.

Maynard Smith J. Evolution and the Theory of Games. Cambridge : Cambridge Univ. Press, 1982.

VIII, 224 p.

Maynard Smith J., Price G. A. The logic of animal conflict // Nature. 1973. Vol. 246. № 5427.

P. 15–18.

Nash J. Non-Cooperative Games // The Essential John Nash / ed. by H. W. Kuhn, S. Nasar. Prin-ceton : Princeton Univ. Press, 2002. P. 51–98.

Neumann J. von, Morgenstern O. Theory of Games and Economic Behavior. Princeton: Princeton

Univ. Press, 2007. 648 p. (Рус. пер.: Нейман Дж. фон, Моргенштерн О. Теория игр и эконо-мическое поведение. М. : Наука, 1970. 707 c.)

Sigmund K. John Maynard Smith and evolutionary game theory // Theoretical Population Biology.

2005. Vol. 68. № 1. P. 7–10.

Formation of the Game-Theoretical Modeling for Evolution

E. F. Karavaev

St. Petersburg State University

St. Petersburg, Russia: EK1549@ek1549.spb. edu

The article is devoted to the historical and methodological problems of formation of the game-theoretical modeling for evolution. As far back as 1930 when R. Fisher investigated the problem of the sex ratio stability he used in fact some game-theoretical ideas and had come near enough to the idea of evolutionarily stable strategy (ESS). It is possible to assess similarly contributions by some other researchers (K. Lewontin, W. Hamilton, for example). Also note that all of them could not acquaint with some valuable ideas which been formulated in the 1949 thesis of John Nash because these were published only

25 years later. In 1973 G. Price and J. Maynard Smith published the paper which found itself in prospect a genuine break-through in the new field. In 1982 Maynard Smith pub — lished the book “Evolution and the Theory of Games”. Further, there are typical examples of games in our article. Also some elucidations of the concept ESS are given.

Keywords: evolution, population, individ, fitness, modeling, game theory, evolutionarily stable strategy.

Материал взят из: Чарльз Дарвин и современная биология. Труды Международной научной конференции (21–23 сентября 2009 г., Санкт — Петербург)