ВОЗНИКНОВЕНИЕ НОВЫХ БЕЛКОВ ЗА СЧЕТ ДУПЛИКАЦИЙ ГЕНОВ

Г. А. Журавлева

Кафедра генетики и селекции Санкт-Петербургского государственного университета

Санкт-Петербург, Россия: zhouravleva@rambler. ru

Дупликации генов играют доминирующую роль в создании новых генов. Общепри — знанно, что для эволюции более важна дупликация генома, а не отдельных его частей, так как в последнем случае возможно возникновение регуляторного дисбаланса из — за частичной дупликации регуляторных элементов генома. Известно, что полиплои- дизации генома происходили на протяжении эволюционной истории всех четырех эукариотических царств: растений, животных, грибов и протист. Сохранение ду — плицированных копий в эволюции может обеспечиваться одним их трех процессов:

1) неофункционализацией; 2) субфункционализацией; 3) консервацией. Одним из вариантов неофункционализации является образование «химерных», или слитных, генов. В обобщенном виде этот процесс известен под названием блочных перестроек генов. Это явление становится возможным вследствие дупликации всего гена или его части, так как лишь в этом случае оно не приведет к нарушению функции ис — ходного гена. В настоящее время выделяют три типа эволюции семейств генов. Два самых простых типа — дивергенция и согласованная эволюция. При третьем способе, названном «рождение и смерть генов», комбинируются первые два способа.

Ключевые слова: дупликация, дивергенция, эволюция, полиплоидизация, неофунк — ционализация, субфункционализация.

1. Роль дупликаций в эволюции

Чарльз Дарвин знаменит своим вкладом в развитие эволюционной теории. Го — раздо менее известен тот факт, что он был также хорошим ботаником и написал несколько книг, посвященных цветковым растениям. Будучи честным ученым, Дарвин не скрывал своей неспособности объяснить внезапное появление и быстрое распространение покрытосеменных растений с точки зрения теории эволюции, на — зывая это явление «отвратительной тайной» (abominable mystery). Одним из воз — можных объяснений загадки, волновавшей Ч. Дарвина, может быть то, что в начале дивергенции покрытосеменных произошло несколько последовательных дуплика — ций генома их древнего предшественника, что и позволило вновь возникавшим ва — риантам быстро накапливать изменения и дивергировать (Cui et al., 2006).

Предположения о возможной роли дупликаций генов в эволюции существова — ли еще в 1930-е гг. (Sturtevant, 1925; Haldane, 1932; Muller, 1936; Lewis, 1951). Но лишь бурное развитие методов молекулярной биологии позволило идентифициро — вать многочисленные повторяющиеся последовательности, показавшие высокую частоту дупликаций генов в эволюции. На основе этих данных С. Оно (Ohno, 1970) выдвинул предположение о том, что дупликация генов — единственный способ воз — никновения новых генов.

Известны различные типы дупликаций ДНК, это 1) дупликация части гена (или внутренняя дупликация); 2) дупликация одного гена; 3) дупликация части хромо — сомы; 4) дупликация всей хромосомы; 5) дупликация генома, или полиплоидия. Первые четыре типа дупликаций иногда объединяют под термином “SSD” (smaller

scale duplication) (Davis, Petrov, 2005). Другие авторы предлагают термин «парало — гон» (производное от паралог) для протяженных дуплицированных участков, со- держащих паралоги, вводя термин SGD (single gene duplication) для дупликаций отдельных генов (Durand. Hoberman, 2006). Дупликации всего генома обозначают как “WGD” (whole genome duplication) (Davis, Petrov, 2005). С точки зрения С. Оно, для эволюции более важна дупликация генома, а не отдельных его частей, так как в последнем случае возможно возникновение регуляторного дисбаланса из-за ча — стичной дупликации регуляторных генов и/или элементов генома (Ohno, 1970).

2. Внутренние дупликации

Предложено несколько механизмов усовершенствования функций белков и создания новых функций. Одним из таких механизмов являются внутренние (ча — стичные) дупликации генов, играющие важную роль в увеличении функциональной сложности генов в эволюции (Li, 1997). Считается, что такие дупликации сыграли ключевую роль в возникновении сложных генов. Многие белки современных орга — низмов обнаруживают внутренние повторы аминокислотных последовательностей (табл. 1), и эти повторы часто соответствуют функциональным или структурным доменам белков. Эти данные позволили предположить, что гены, кодирующие эти белки, образовались за счет внутренних дупликаций (Lavorgna et al., 2001). Вну — тренние дупликации обеспечивают улучшение функций белка за счет увеличения числа активных сайтов, приобретения дополнительной функции за счет моди — фикации избыточного участка, а также участия в блочных перестройках. Много — численные данные о роли внутригенных дупликаций на ранних этапах эволюции белков получены при сравнительном анализе секвенированных геномов (Marcotte et al., 1999; Lavorgna et al., 2001; Conant, Wagner, 2005; Chen et al., 2007). В случае фиксации дупликаций в ходе эволюции в дуплицированных участках могло проис — ходить накопление мутаций, что способствовало дивергенции повторенных фраг — ментов. Поэтому в современных аминокислотных последовательностях могут быть обнаружены только следы дупликаций в виде несовершенных повторов (табл. 1). Эукариотические белки характеризуются большим числом повторов по сравнению с прокариотическими (Marcotte et al., 1999; Chen et al., 2007).

Таблица 1

Внутренние дупликации привели к появлению белков человека с повторяющимися структурными доменами1

Белки

Размер

(ак)

Повтор

(ак)

Число повторов

Процент идентичности в повторе

β-гликопротеин

Фибронектин

Гексокиназа

Рецептор интерлейкина-2

Иммуноглобулин γ (С-область)

474

2324

917

251

329

91

40

447

68

108

5

12

2

2

3

96

21

97

54

98

1 Источник: Li, 1997.

3. Дупликации генома

Древние полиплоидизации всего генома были проанализированы во всех четы — рех эукариотических царствах: растений, животных, грибов и протист. Во всех этих случаях доля генов, сохранившихся в виде дуплицированных копий, варьирует от

10 до 50 % и чаще всего коррелирует со временем, прошедшем с момента дупли — кации (Scannell et al., 2006). Тем не менее характерным является то, что у многих видов в виде дубликатов сохраняются сходные функциональные классы генов.

Известно, что у растений дупликация генома является широко распространен — ной (Vision et al., 2000; Adams, Wendel, 2005) (рис. 1). Оценки частоты встречаемо — сти полиплоидии у покрытосеменных варьируют от 30 до 80 %, и около 3 % событий видообразования объясняют за счет дупликаций генома (Otto, Whitton, 2000). Та — ким образом, возможно, что многие (если не все) виды растений имеют по край — ней мере одного полиплоидного предка. Предполагается, что большинство эвдикот (Eudicots) произошло от древнего гексаплоидного предшественника с последующей тетраплоидизацией в некоторых таксонах (Jaillon et al., 2007). При этом у тополя (Populus trichocarpa) и бобовых произошла одна такая тетраплоидизация (Cannon et al., 2006; Tuskan et al., 2006), в то время как у арабидопсиса — две (Simillion et al.,

2002; Conant, Wagner, 2005), а у винограда — ни одной (Jaillon et al., 2007).

Дупликация всего генома у дрожжей S. cerevisiae привела к первоначально — му увеличению числа генов от 5000 к 10 000, но последующие потери паралогов привели к сохранению у современных дрожжей-сахаромицетов около 5500 белок- кодирующих генов, из которых 1102 формируют 551 паралогичную пару (Byrne,

Рис. 1. Предполагаемые события полиплоидизации (серые овалы) во время эволюции покрытосеменных. Длина ветвей показана не в масштабе. Цифры соответствуют време — ни (в млн. лет) с момента дупликации. Модифицировано из (Adams, Wendel, 2005)

Wolfe, 2005). Для паралогов, возникших в результате WGD, в честь С. Оно был пред — ложен специальный термин «онологи» (от “ohnologes”) (Wolfe, 2000).

Обнаружение естественной полиплоидизации является сложной задачей, осо — бенно если речь идет о древнем событии. Недавние дупликации могут быть обна- ружены при сравнении близкородственных видов, один из которых претерпел ди — плоидизацию и поэтому содержит вдвое больше хромосом по сравнению с другим, который не диплоидизировался. В частности, сравнение геномов Ashbya gossypii и S. cerevisiae позволило установить, что оба вида произошли от одного предшествен- ника, содержавшего семь или восемь хромосом (Dietrich et al., 2004). Изменения числа хромосом за счет перестроек, в частности транслокаций, привело к появлению предков A. gossypii и S. cerevisiae. Диплоидизация генома S. cerevisiae предоставила этому виду новые возможности фукнциональной дивергенции, отсутствовавшие у A. gossypii. Аналогичный сравнительный анализ проведен также для S. cerevisiae и его ближайшего «недуплицированного» родственника Kluyveromyces waltii (Kellis et al., 2004).

Тем не менее, чем древнее дупликация, тем труднее такой анализ, так как вслед за полиплоидизацией следует период диплоидизации, который завершается «пре — вращением» полиплоидного генома в диплоидный. Достигается это интенсивной потерей генов, перестройками генома и различными способами дивергенции генов, оставшихся в виде дуплицированных копий. Кроме того, недавний анализ показал, что дупликации отдельных генов происходили в эволюции гораздо чаще, чем ра — нее предполагалось, и их частота позволила бы дуплицировать целый геном каждые

100 млн лет (Lynch, Conery, 2000; Lynch et al., 2001).

Процесс диплоидизации был проанализирован на многочисленных геномных

данных, в том числе геномах растений (Chapman et al., 2006; Tuskan et al., 2006;

Jaillon et al., 2007), костистых рыб (Brunet et al., 2006), дрожжей (Piskur 2001; Kellis

et al., 2004; Scannell et al., 2006; Scannell et al., 2007), парамеции (Aury et al., 2006) и

позвоночных (Blomme et al., 2006). Предполагается, что растения многократно ис-пользовали полиплоидизацию в ходе своей эволюции как за счет возможности ве-гетативного размножения, так и за счет существования специфических механизмов

регуляции в растительной клетке. В частности, показано, что у модельных поли-плоидов наблюдаются быстрые потери одних генов и специфическая инактивация

других за счет метилирования (Comai et al., 2000; Lee, Chen, 2001; Kashkush et al.,

2002). Предполагается, что эпигенетический сайленсинг может защищать дупли-цированные копии от превращения в псевдогены и таким образом способствовать

приобретению ими новых функций (Rodin, Riggs, 2003).

Геном позвоночных содержит множество семейств генов, которые не обнаружи-ваются у беспозвоночных, и, по-видимому, многие дупликации генов произошли на

ранних этапах эволюции хордовых (Taylor, Raes, 2004). Еще C. Оно было высказано

предположение, что сложный геном позвоночных возник в результате двух раундов

(2R) геномных дупликаций (Ohno, 1970). Эта точка зрения как будто поддержива-лась утверждением, что геном человека содержит около 100 тысяч генов, что в четыре

раза превышает оценку числа генов в геномах беспозвоночных. Секвенирование ге-нома человека уменьшило число его генов в несколько раз, но не ответило на вопрос

о числе и возможностях дупликаций у его предков. В то время как одни авторы про-должают придерживаться гипотезы 2R (например, Spring 1997; Meyer, Schartl, 1999;

Wang, Gu, 2000; Larhammar et al., 2002; Dehal, Boore, 2005), другие обнаруживают

только один раунд WGD (Guigo et al., 1996; Gu et al., 2002a; McLysaght et al., 2002), в то время как третьи отрицают возможность WGD и говорят лишь о дупликациях ограниченного числа сегментов (Friedman, Hughes, 2001, 2003).

4. Судьба дуплицированных генов

По прошествии десятков миллионов лет после полиплоидизации геномов A. thaliana и S. cerevisiae лишь около 30 % и 10 % генов каждого генома сохранились в виде дуплицированных копий (Seoighe, Wolfe, 1999; Wong et al., 2002; Blanc et al.,

2003). Сохранение дуплицированных копий в эволюции может обеспечиваться од — ним их трех процессов: 1) неофункционализацией, при которой один из паралогов приобретает новую функцию, в то время как другой сохраняет старую, «древнюю» функцию; 2) субфункционализацией, при которой оба паралога необходимы для выполнения функции, которую ранее обеспечивал предковый ген (Ohno, 1970) (термины предложены (Force et al., 1999)); 3) консервацией, при которой копии сохраняются в неизменном состоянии (Hahn, 2009). Характерно, что в (1) и (2) слу — чаях возможно изменение регуляторных и/или структурных частей гена (рис. 2).

Рис. 2. Возможные последствия дупликации генов (модифицировано из (Hahn 2009)).

А и С — изменение регуляторных последовательностей;

В и D — изменение структурных. Т. к. вариант 3 (консервация) не приводит к изменению дуплицированных копий, он на схеме не представлен

4.1. Сохранение, или консервация, дуплицированных копий

Дуплицированные гены сохраняются в тех случаях, когда для нормального раз — вития организма необходимы многие копии генов с одинаковой функцией, что по — зволяет синтезировать большие количества специфических РНК или белков (Ohno,

1970). Показано, что увеличение копий таких генов коррелирует с увеличением сложности организма (Chen et al., 2007). Амплификация генов у микроорганизмов приводит к устойчивости к антибиотикам, ионам тяжелых металлов, увеличению вирулентности и другим адаптивным свойствам (Romero, Palacios, 1997; Reams, Nei — dle, 2004; Andersson, Hughes, 2009). У растений амплификация генов обеспечивает устойчивость к гербицидам (Harms et al., 1992; Shyr et al., 1992). К наиболее извест — ным примерам сохранения дуплицированных копий генов у самых различных ор- ганизмов относятся гены рРНК, тРНК, гистонов, многие из которых организованы в виде тандемных повторов (что позволяет сохранять гомогенность за счет неравно- го кроссинговера или конверсии (Hurles, 2004)).

Одним из наиболее интересных вопросов, связанным с сохранением дуплици — рованных копий генов, является следующий: происходит ли потеря генов случайно или подвергается естественному отбору? Какие дубликаты теряются, а какие сохра — няются после полиплоидизации? Около 13 % дрожжевых генов сохранились в виде дуплицированных копий, причем большая их часть не нужна для обеспечения жиз — неспособности (Gu et al., 2002b). Наиболее часто дуплицированы гены, кодирующие такие белки, как циклины, компоненты пути сигнальной трансдукции, цитоплазма — тические (но не митохондриальные) рибосомные белки (табл. 2). Большинство из них характеризуется высоким уровнем экспрессии. Возможно, основным фактором отбора на сохранение генов в дуплицированном состоянии был отбор на увеличение уровня их экспрессии (Seoighe, Wolfe, 1999).

Создание дополнительной копии гена приводит к увеличению количества транскрипта2

Таблица 2

Белки

Количество белков

Процент дубликатов

Всего в геноме дрожжей

Циклины

Фосфатазы

Белки теплового шока

Киназы

Метаболизм глюкозы

Метаболизм аминокислот

Факторы транскрипции

Рибосомные белки

5792

22

40

32

123

223

189

261

165

12,9

54,5

2). Большинство из них характеризуется высоким уровнем экспрессии. Возможно, основным фактором отбора на сохранение генов в дуплицированном состоянии был отбор на увеличение уровня их экспрессии (Seoighe, Wolfe, 1999).

Создание дополнительной копии гена приводит к увеличению количества транскрипта2

Таблица 2

Белки

Количество белков

Процент дубликатов

Всего в геноме дрожжей

Циклины

Фосфатазы

Белки теплового шока

Киназы

Метаболизм глюкозы

Метаболизм аминокислот

Факторы транскрипции

Рибосомные белки

5792

22

40

32

123

223

189

261

165

12,9

54,5

32,5

31,3

29,3

26,0

12,7

12,3

50,3

Анализ наименее древней дупликации генома у арабидопсиса выявил преиму — щественное сохранение генов, участвующих в транскрипции и сигнальной транс — дукции, в то время как другие классы, вовлеченные в репарацию ДНК или кодиро — вание белков органелл, характеризуются более частой потерей (Blanc, Wolfe, 2004). Интересно, что гены, сохранившиеся в виде паралогов после дупликации, имеют высокую вероятность остаться дуплицированными после следующего раунда ду — пликации (Seoighe, Gehring, 2004). Таким образом, потеря дубликатов не является случайным процессом.

2 Источник: Seoighe, Wolfe, 1999.

4.2. Субфункционализация

Эта модель объясняет появление новых генов при дупликации мультифункцио — нальных генов. Такие гены кодируют белки, уже выполняющие в клетке различные функции. Это явление было открыто у кристаллинов (табл. 3), которые использу — ются в хрусталике глаза. Они составляют до 70 % содержимого клеток, но при этом остаются в растворимой форме, не образуя агрегатов (образование агрегатов приво — дит к катаракте). В подобных условиях большинство белков в течение нескольких секунд образовали бы нерастворимые агрегаты. Другой особенностью этих белков является рекордное время жизни (равное времени жизни индивидуума, т. е. напри — мер 80 лет), для большинства белков это время составляет минуты или часы. Суще — ствует стандартный набор кристаллинов (a, b, g) в глазах всех позвоночных и допол- нительные видоспецифичные кристаллины, кодируемые генами, которые в других тканях кодируют ферменты (табл. 3). В большинстве случаев такая двойная жизнь обеспечивается не дупликациями, а «разделением функций», т. е. и фермент, и кри — сталлин кодируются одним геном, при этом белок начинает выполнять дополни — тельные функции без изменения своей аминокислотной последовательности. Этот феномен был назван «разделением функций» (gene sharing) (Piatigorsky et al., 1988; Piatigorsky 2003). Это означает, что ген приобретает вторую функцию без дуплика — ции и без потери первичной функции. Тем не менее при этом может происходить изменение тканеспецифичности или регуляции в ходе развития.

Таблица 3

Выполнение различных функций одними и теми же белками (gene sharing)3

Кристаллин

Распространение

Функция

A b g

δ

ε

ζ

τ

Все позвоночные Все позвоночные Все позвоночные Птицы, рептилии

Некоторые птицы, крокодилы Морская свинка, верблюд Многие позвоночные

Кристаллин Кристаллин Кристаллин

Аргинино-сукцинат лиаза

Лактат-дегидрогеназа В

НАДФН: хинон оксидоредуктаза

Энолаза

Приобретение новой функции без дупликации вначале было обнаружено у

кристаллина ε птиц и крокодилов, который по своей аминокислотной последова-тельности идентичен лактат Gal4, активирующего путь утилизации галактозы. Оба гена произошли из одного бифункционального гена, при этом Gal3 потерял ферментативную активность, а Gal1 — регуляторные свойства. Следует отметить, что изменилась и регуляция обоих генов (Рис. 3). В случае GAL1 изменилось расположение сайтов присоединения димеров Gal4, приведя к их ориентации с одной стороны спирали, что приводит к кооперативно — му присоединению Gal4 и в то же время его более эффективной репрессией Gal80.

Рис.3. Эволюция генов GAL после дупликации (модифицировано из (Hittinger& and Carroll, 2007)). Общий предок K. lactis и S. cerevisiae содержал ген GAL1/3. После дупликации у S. cerevisiae одна копия (GAL1) стала кодировать фермент галактокиназу, а вторая (GAL3) — регуляторный белок

Gal3. Эта субфункционализация сопровождается реорганизацией регуляторных после- довательностей, к которым присоединяется фактор транскрипции Gal4 (серый овал)

Совокупность этих событий привела к появлению строго контролируемого и высоко индуцибельного гена GAL1. Белок репрессирован в отсутствии галактозы, в ее присутствии уровень синтеза увеличивается в 1000 раз, в отличие от гена. GAL3 с максимальным уровнем индукции в 3–5 раз. У K. lactis обе функции выполняет белок, кодируемый одним геном. При этом сверхэкспрессия модуля, соответству- ющего GAL1, увеличивает приспособленность, а модуля, соответствующего GAL3, — уменьшает. Это приводит к конфликту, которого нет у дрожжей-сахаромицетов. Таким образом адаптивная эволюция привела к оптимальной регуляции гена, ко — дирующего первый фермент пути утилизации галактозы, при этом сделав ее неза — висимой от коиндуктора этого пути — Gal3.

 

Рис. 4. Схема, иллюстрирующая согласованную дивергенцию. Стрелки показывают, что продук — ты неродственных генов 1 и 2 взаимодействуют. Паралоги А и В отличаются или тем,

что экспрессируются в разных тканях, или уров — нем экспрессии. Модифицировано из (Blanc & Wolfe, 2004)

Дивергенция в экспрессии дуплицированных генов в течение длительного вре — мени привлекала интерес ученых, так как ее рассматривали как важный этап в воз — никновении нового гена при дупликации (Ohno, 1970; Ferris, Whitt, 1979). Таким образом, в ряде случаев кодирующие последовательности дубликатов могут оста — ваться идентичными, сочетаясь с изменениями в регуляторных последовательно- стях. Обнаружено, что некоторые пары дуплицированных генов могут дивергиро — вать согласованно, образуя две группы, отличающиеся экспрессией или в разных тканях, или при разных условиях (Blanc, Wolfe, 2004) (рис. 4). Этот процесс, объ — ясняющий дивергенцию метаболических путей, авторы назвали «согласованной дивергенцией».

4.3. Неофункционализация

Для того чтобы дуплицированные копии генов стабильно поддерживались в ге — номе, необходима их функциональная дивергенция. С точки зрения С. Оно (1970), возможность этого события достигается за счет того, что одна копия гена сохраняет старую функцию, в то время как другая приобретает новую. При этом неизбежной промежуточной стадией в этом процессе должно быть возникновение псевдогена, так как большинство мутаций будут нарушать или инактивировать ген, а не при — водить к возникновению новой функции. Поскольку это событие считается крайне маловероятным, то была предложена расширенная гипотеза неофункционализации (NF), включающая следующие варианты: 1) ген, приобретающий новые функции, сохраняет и все старые (NF-I); 2) новый ген полностью теряет все старые функции (NF-II); 3) новый ген сохраняет часть старых функций (NF-III) (He, Zhang, 2005).

При этом модель С. Оно соответствует варианту 2. В последние годы описано доста — точно примеров неофункционализации (Hahn 2009), хотя в ряде случаев ее доста — точно трудно отличить от субфункционализации, что привело к созданию модели

«субнеофункционализации» (He, Zhang, 2005).

4.4. Блочные перестройки генов как вариант неофункционализации

Одним из вариантов неофункционализации является образование «химерных», или слитных, генов (Long, 2000). В обобщенном виде этот процесс известен под на — званием блочных перестроек генов. Это явление становится возможным вследствие дупликации всего гена или его части, так как лишь в этом случае оно не приведет к нарушению функции исходного гена. После дупликации ген может захватывать экзон(ы) из неродственного соседнего гена. Другим вариантом является присоедине- ние фланкирующей некодирующей ДНК в качестве дополнительной открытой рамки считывания. Модель, известная под названием «перетасовка экзонов» (exon shuffling) (Gilbert, 1978), предполагает, что рекомбинация в интронах могла бы обеспечить ме — ханизм для обмена последовательностями экзонов между генами. Однако только в том случае, когда в событие вовлечен структурный или функциональный домен, оно станет эволюционно значимым. Более того, тасовка доменов может происходить и без участия интронов (Doolittle, 1995). Таким образом, более правильно говорить о та — совке доменов, а не экзонов. В прокариотических генах не найдено интронов, но у них описано много случаев тасовки доменов. Тем не менее существование интронов зна- чительно облегчило тасовку доменов, особенно у позвоночных. За 30 лет, прошедших с момента открытия интронов, обнаружено много примеров тасовки экзонов у самых различных организмов (позвоночных, беспозвоночных, растений). Но лишь недавно было показано, что в основе этого явления лежат механизмы незаконной рекомбина — ции и ретротранспозиции (Long et al., 2003; van Rijk, Bloemendal, 2003).

Данных, полученных к настоящему времени, явно недостаточно для того, что — бы решить, какой из способов (неофункционализация, субфункционализация или консервация генов) используется более часто в эволюции. Возможно, что «выбор» способа зависит от механизма, приведшего к возникновению дуплицированной копии. Очевидно, что дупликация за счет полиплоидизации должна приводить к другим последствиям, чем дупликация за счет ретропозиции, так как в последнем случае ген попадает в новое хромосомное окружение, что должно способствовать его неофункционализации (Hahn, 2009).

5. Рождение и смерть генов

Все гены, которые принадлежат к определенной группе повторяющихся после — довательностей в геноме, образуют семейство генов, или мультигенное семейство. Обычно члены семейства тесно сцеплены друг с другом, хотя в некоторых случаях некоторые члены могут локализоваться на других хромосомах.

Когда дуплицированные гены становятся слишком отличными друг от друга как по своим функциям, так и по последовательности, то их становится трудно и неудобно относить к одному и тому же семейству. Поэтому М. Дайхофф (Dayhoff,

1976) предложила термин «надсемейство» (superfamily) для того, чтобы отделить близкородственные белки от отдаленно родственных.

Группируя белки по их функциональной роли в метаболизме и другим прояв — лениям, М. Дайхофф предложила ввести несколько таксономических категорий по степени различия аминокислотных последовательностей: надсемейство (<85–90 % различий), семейство (<50 %), подсемейство (<20 %). В 1984 г. изученные белки подразделялись на 181 надсемейство, 314 семейств и 537 подсемейств, включающие около 4000 белков.

При отнесении белка к определенному семейству также учитываются функцио-нальное сходство белков и тканеспецифичность. Например, α-глобины человека и

карпа идентичны только на 46 %, т. е. их невозможно было бы отнести к одному

семейству только на основе сравнения последовательностей.

После дупликации гена каждый дуплицированный локус необязательно эволю-ционирует независимо. Напротив, дубликаты, по-видимому, иногда обмениваются

последовательностями с помощью некоторого механизма, который поддерживает

тесную гомологию последовательностей этих двух локусов. Этот процесс был на-зван согласованной эволюцией.

В настоящее время выделяют три типа эволюции семейств генов. Два самых

простых типа — дивергенция и согласованная эволюция. При третьем способе эво-люции семейств генов комбинируются первые два способа. Если дупликации генов

семейства происходят часто, то это дает начало новым генам. Они будут похожи

друг на друга, как при согласованной эволюции. Число генов растет незначитель-но, так как часть из них элиминируется: они становятся псевдогенами и умирают.

В результате этот тип эволюции выглядит как смесь дивергентной и согласованной

эволюции и называется «рождение и смерть генов» (Niimura, Nei, 2006). Рождение

и смерть генов может быть случайным или быть под контролем отбора. Й. Нииму-ра и М. Ней проследили судьбу дуплицированных генов на примере генов, коди-рующих рецепторы обоняния у различных организмов. Геном человека содержит

388 различных генов OR (olfactory receptor), а также 414 псевдогенов. Присутствие

в псевдогене единичных мутаций свидетельствует о его недавнем возникновении;

напротив, накопление множественных мутаций, включая протяженные инсерции

и делеции, говорит о потере функциональности миллионы лет назад. Ни один из

OR генов не содержит интронов, это является достоинством данной модели, так как

в этом случае достаточно легко узнать гены и псевдогены, анализируя геном. Гены

и псевдогены человека кластерированы. Некоторые кластеры содержат десятки ге-нов, в то время как другие — всего несколько генов. Все хромосомы человека (кроме

20 и Y) содержат 95 различных кластеров.

Филогенетическое дерево 388 функциональных генов OR выявляет два основ-ных класса. Все 57 генов I класса кластерированы на хромосоме 11. Гены II класса

могут быть подразделены на несколько подгрупп, обозначенных от A до S. При-мечательно то, что гены, принадлежащие к одному классу, имеют тенденцию рас-полагаться рядом. Соседние, тесно родственные гены, которые транскрибируются

в одном направлении, скорее всего, возникли в результате дупликации.

Геном мыши содержит 1037 функциональных генов и 354 псевдогена в 69 кла-стерах. Как и ожидалось, у мыши больше генов обонятельных рецепторов, чем у че-ловека. Большинство этих кластеров картируется аналогично родственным класте-рам генома человека. Как эволюционируют гены этого большого семейства? Ясно,

что общий предшественник мыши и человека должен был иметь много генов OR.

Похоже, что число генов значительно менялось в одной или в обеих линиях. Почему

и как некоторые гены были инактивированы? Происходит ли эволюция семейств генов благодаря естественному отбору или чему-то еще?

Ниимура и Ней смогли ответить на некоторые из этих вопросов благодаря сек — венированию геномов человека и мыши. Сравнение последовательностей всех OR генов и псевдогенов позволило определить, что наиболее близкий предок (MCRA, Most Recent Common Ancestor) мыши и человека обладал 754 генами. Из них 691 до сих пор работают у мыши, но только 326 — у человека. Это исследование было рас — ширено за счет анализа геномов других организмов. Предшественник бесчелюст — ных и челюстных рыб имел два гена. Каждый из этих генов дал начало двум подсе- мействам у рыб, так, что MCRA рыб и тетрапод имел шесть генов первого класса и три гена второго класса. В ходе эволюции в линиях, ведущих к современным рыбам, амфибиям, птицам и млекопитающим, происходило увеличение или уменьшение числа генов в каждом подсемействе. Это и есть эволюция, названная «рождением и смертью генов» (Niimura, Nei, 2006).

6. Заключение

Существуют многочисленные гипотезы о количестве различных белков на на — чальных этапах эволюции. Одни авторы считают, что на ранних стадиях жизни было немного небольших белков, многие современные белки произошли из них за счет дупликаций и модификаций (Doolittle, 1995). Другие предполагают, что существо — вало большое число полипептидов, и все современные белки произошли в резуль — тате тасовки этих первичных структурных единиц (Dorit, Gilbert, 1991). Возможен и промежуточный сценарий, согласно которому дупликация генов с последующей дивергенцией и пересортировкой экзонов привела к современному разнообразию белков (Aravind, Subramanian, 1999). Согласно точке зрения Ф. Жакоба (Jacob,

1977) (“evolution as tinkering”) эволюция не работает, как хороший инженер, кото — рый мечтает сделать работу наилучшим образом, согласно детальному плану и ис- пользуя специальные материалы. Напротив, она использует любой материал, попа — дающий в руки, и создает нечто, выполняющее новые функции, но первоначально совсем не наилучшим способом. Вслед за этим наступает этап подгонки. В случае справедливости этого предположения вновь возникшие гены должны быстро изме — няться. Таким образом, дупликация генов является основным источником новых генов (Ohno, 1970) и в связи с этим — центральной силой, управляющей эволюцией генома (Wolfe, Li, 2003).

Работа поддержана грантами РФФИ (07-04-00605) и программы Президиума

РАН «Происхождение биосферы и эволюция геобиологических систем».

Литература

Adams K. L., Wendel J. F. Polyploidy and genome evolution in plants // Current Opinion in Plant

Biology. 2005. Vol. 8. P. 135–141.

Andersson D. I., Hughes D. Gene Amplification and Adaptive Evolution in Bacteria // Annual Re — view of Genetics. 2009. P. 43 167–43 195.

Aravind L., Subramanian G. Origin of multicellular eukaryotes — insights from proteome compari — sons // Current Opinion in Genetics & Development. 1999. Vol. 9. P. 688–694.

Aury J. M., Jaillon O., Duret L. et al. Global trends of whole-genome duplications revealed by the ciliate Paramecium tetraurelia // Nature. 2006. Vol. 444. P. 171–178.

Blanc G., Hokamp K., Wolfe K. H. A recent polyploidy superimposed on older large-scale duplica — tions in the Arabidopsis genome // Genome Research. 2003. Vol. 13. P. 137–144.

Blanc G., Wolfe K. H. Widespread paleopolyploidy in model plant species inferred from age distribu — tions of duplicate genes // The Plant Cell. 2004. Vol. 16. P. 1667–1678.

Blomme T., Vandepoele K., De Bodt S. et al. The gain and loss of genes during 600 million years of vertebrate evolution // Genome Biology. 2006. Vol. 7. R43.

Brunet F. G., Crollius H. R., Paris M. et al. Gene loss and evolutionary rates following whole- genome duplication in teleost fishes // Molecular Biology and Evolution. 2006. Vol. 23. P. 1808–1816.

Byrne K. P., Wolfe K. H. The Yeast Gene Order Browser: combining curated homology and syn — tenic context reveals gene fate in polyploid species // Genome Research. 2005. Vol. 15. P. 1456–1461.

Cannon S. B., Sterck L., Rombauts S. et al. Legume genome evolution viewed through the Medicago truncatula and Lotus japonicus genomes // Proceeding of the National Academy of Sciences of USA 2006. Vol. 103. P. 14 959–14 964.

Chapman B. A., Bowers J. E., Feltus F. A., Paterson A. H. Buffering of crucial functions by paleologous duplicated genes may contribute cyclicality to angiosperm genome duplication // Proceeding of the National Academy of Sciences of USA. 2006. Vol. 103. P. 2730–2735.

Chen C. C., Li W. H. and Sung H. M. Patterns of internal gene duplication in the course of metazoan evolution // Gene. 2007. Vol. 396. P. 59–65.

Comai L., Tyagi A. P., Winter K. et al. Phenotypic instability and rapid gene silencing in newly formed

Arabidopsis allotetraploids // The Plant Cell. 2000. Vol. 12. P. 1551–1568.

Conant G. C., Wagner A. The rarity of gene shuffling in conserved genes // Genome Biology. 2005.

Vol. 6. R50.

Cui L., Wall P. K., Leebens-Mack J. H. et al. Widespread genome duplications throughout the history

of flowering plants // Genome Research. 2006. Vol. 16. P. 738–749.

Davis J. C., Petrov D. A. Do disparate mechanisms of duplication add similar genes to the genome? //

Trends in Genetics. 2005. Vol. 21. P. 548–551.

Dayhoff M. O. The origin and evolution of protein superfamilies // Federation Proceedings. 1976.

Vol. 35. P. 2132–2138.

Dehal P., Boore J. L. Two rounds of whole genome duplication in the ancestral vertebrate // PLoS.

Biology. 2005. Vol. 3, e314.

Dietrich F. S., Voegeli S., Brachat S. et al. The Ashbya gossypii genome as a tool for mapping the an-cient Saccharomyces cerevisiae genome // Science. 2004. Vol. 304. P. 304–307.

Doolittle R. F. The multiplicity of domains in proteins // Annual Review of Biochemistry. 1995.

Vol. 64. P. 287–314.

Dorit R. L., Gilbert W. The limited universe of exons // Current Opinion in Genetics & Develop-ment. 1991. Vol. 1. P. 464–469.

Durand D., Hoberman R. Diagnosing duplications — can it be done? // Trends in Genetics. 2006.

Vol. 22. P. 156–164.

Ferris S. D., Whitt G. S. Evolution of the differential regulation of duplicate genes after polyploidiza-tion // Journal of Molecular Evolution. 1979. Vol. 12. P. 267–317.

Force A., Lynch M., Pickett F. B. et al. Preservation of duplicate genes by complementary, degenera-tive mutations // Genetics. 1999. Vol. 151. P. 1531–1545.

Friedman R., Hughes A. L. Pattern and timing of gene duplication in animal genomes // Genome

Research. 2001. Vol. 11. P. 1842–1847.

Friedman R., Hughes A. L. The temporal distribution of gene duplication events in a set of highly con-served human gene families // Molecular Biology and Evolution. 2003. Vol. 20. P. 154–161.

Gilbert W. Why genes in pieces? // Nature 1978. Vol. 271. P. 501.

Gu X., Wang Y. and Gu J. Age distribution of human gene families shows significant roles of both large — and small-scale duplications in vertebrate evolution // Nature Genetics. 2002a. Vol. 31. P. 205–209.

Gu Z., Cavalcanti A., Chen F. C. et al. Extent of gene duplication in the genomes of Drosophila, nema — tode and yeast // Molecular Biology and Evolution. 2002b. Vol. 19. P. 256–262.

Guigo R., Muchnik I., Smith T. F. Reconstruction of ancient molecular phylogeny // Molecular Phy- logenetics and Evolution. 1996. Vol. 6. P. 189–213.

Hahn M. W. Distinguishing among evolutionary models for the maintenance of gene duplicates // Journal of Heredity. 2009. Vol. 100. P. 605–617.

Haldane J. The causes of evolution. N. Y. : Longmans, Green, 1932. VII, 234 p.

Harms C. T., Armour S. L., DiMaio J. J. et al. Herbicide resistance due to amplification of a mu — tant acetohydroxyacid synthase gene // Molecular and General Genetics. 1992. Vol. 233. P. 427–435.

He X., Zhang J. Rapid subfunctionalization accompanied by prolonged and substantial neofunction — alization in duplicate gene evolution // Genetics. 2005. Vol. 169. P. 1157–1164.

Hittinger C. T., Carroll S. B. Gene duplication and the adaptive evolution of a classic genetic switch // Nature. 2007. Vol. 449. P. 677–681.

Hurles M. Gene duplication: the genomic trade in spare parts // PLoS Biology. 2004. Vol. 2. E206.

Jacob F. Evolution and tinkering // Science. 1977. Vol. 196. P. 1161–1166.

Jaillon O., Aury J. M., Noel B. et al. The grapevine genome sequence suggests ancestral hexaploidiza — tion in major angiosperm phyla // Nature. 2007. Vol. 449. P. 463–467.

Kashkush K., Feldman M., Levy A. A. Gene loss, silencing and activation in a newly synthesized wheat allotetraploid // Genetics. 2002 . Vol. 160. P. 1651–1659.

Kellis M., Birren B. W., Lander E. S. Proof and evolutionary analysis of ancient genome duplication in the yeast Saccharomyces cerevisiae // Nature. 2004. Vol. 428. P. 617–624.

Larhammar D., Lundin L. G., Hallbook F. The human Hox-bearing chromosome regions did arise by block or chromosome or even genome duplications // Genome Research. 2002. Vol. 12. P. 1910–1920.

Lavorgna G., Patthy L., Boncinelli E. Were protein internal repeats formed by “bricolage”? // Trends in Genetics. 2001. Vol. 17. P. 120–123.

Lee H. S., Chen Z. J. Protein-coding genes are epigenetically regulated in Arabidopsis polyploids // Proceeding of the National Academy of Sciences USA. 2001. Vol. 98. P. 6753–6758.

Lewis E. B. Pseudoallelism and gene evolution // Cold Spring Harbor Symposia on Quantitative

Biology. 1951. Vol. 16. P. 159–174.

Li W. H. Molecular evolution. Sunderland (Mass.) : Sinauer Associates, 1997. 477 p.

Long M. A new function evolved from gene fusion // Genome Research. 2000. Vol. 10. P. 1655–1657.

Long M., Betran E., Thornton K., Wang W. The origin of new genes: glimpses from the young and old // Nature Review Genetics. 2003. Vol. 4. P. 865–875.

Lynch M., Conery J. S. The evolutionary fate and consequences of duplicate genes // Science. 2000.

Vol. 290. P. 1151–1155.

Lynch M., O’Hely M., Walsh B., Force A. The probability of preservation of a newly arisen gene du- plicate // Genetics. 2001. Vol. 159. P. 1789–1804.

Marcotte E. M., Pellegrini M., Yeates T. O., Eisenberg D. A census of protein repeats // Journal of

Molecular Biology. 1999. Vol. 293. P. 151–160.

McLysaght A., Hokamp K., Wolfe K. H. Extensive genomic duplication during early chordate evolution // Nature Genetics. 2002. Vol. 31. P. 200–204.

Meyer A., Schartl M. Gene and genome duplications in vertebrates: the one-to-four-to-eight in fish rule and the evolution of novel gene functions // Current Opinion in Cell Biology. 1999. Vol. 11. P. 699–704.

Muller H. J. Bar duplication // Science. 1936. Vol. 83. P. 528–530.

Niimura Y., Nei M. Evolutionary dynamics of olfactory and other chemosensory receptor genes in vertebrates // Journal of Human Genetics. 2006. Vol. 51. P. 505–517.

Ohno S. Evolution by Gene Duplication. N. Y. : Springer Verlag, 1970. 160 p.

Otto S. P., Whitton J. Polyploid incidence and evolution // Annual Review of Genetics. 2000.

Vol. 34. P. 401–437.

Piatigorsky J., O’Brien W. E., Norman B. L. et al. Gene sharing by delta-crystallin and arginino-succinate lyase // Proceeding of the National Academy of Sciences of USA. 1988. Vol. 85.

P. 3479–3483.

Piatigorsky J. Crystallin genes: specialization by changes in gene regulation may precede gene dupli-cation // Journal of Structural and Functional Genomics. 2003. Vol. 3. P. 131–137.

Piskur J. Origin of the duplicated regions in the yeast genomes // Trends in Genetics. 2001. Vol. 17.

P. 302–303.

Reams A. B., Neidle E. L. Selection for gene clustering by tandem duplication // Annual Review of

Microbiology. 2004. Vol. 58. P. 119–142.

Rijk A. van, Bloemendal H. Molecular mechanisms of exon shuffling: illegitimate recombination //

Genetica. 2003. Vol. 118. P. 245–249.

Rodin S. N., Riggs A. D. Epigenetic silencing may aid evolution by gene duplication // Journal of

Molecular Evolution. 2003. Vol. 56. P. 718–729.

Romero D., Palacios R. Gene amplification and genomic plasticity in prokaryotes // Annual Review

of Genetics. 1997. Vol. 31. P. 91–111.

Scannell D. R., Byrne K. P., Gordon J. L. et al. Multiple rounds of speciation associated with recipro-cal gene loss in polyploid yeasts // Nature. 2006. Vol. 440. P. 341–345.

Scannell D. R., Butler G., Wolfe K. H. Yeast genome evolution — the origin of the species // Yeast.

2007. Vol. 24. P. 929–942.

Seoighe C., Wolfe K. H. Yeast genome evolution in the post-genome era // Current Opinion in Mi-crobiology. 1999. Vol. 2. P. 548–554.

Seoighe C., Gehring C. Genome duplication led to highly selective expansion of the Arabidopsis

thaliana proteome // Trends in Genetics. 2004. Vol. 20. P. 461–464.

Shyr Y. Y., Hepburn A. G., Widholm J. M. Glyphosate selected amplification of the 5-enolpy-ruvylshikimate-3-phosphate synthase gene in cultured carrot cells // Molecular and General

Genetics. 1992. Vol. 232. P. 377–382.

Simillion C., Vandepoele K., Montagu M. C. van et al. The hidden duplication past of Arabidopsis

thaliana // Proceeding of the National Academy of Sciences USA. 2002. Vol. 99. P. 13 627–

13 632.

Spring J. Vertebrate evolution by interspecific hybridization — are we polyploid? // FEBS Letters.

1997. Vol.400. P. 2–8.

Sturtevant A. H. The Effects of Unequal Crossing over at the Bar Locus in Drosophila // Genetics.

1925. Vol. 10. P. 117–147.

Taylor J. S., Raes J. Duplication and divergence: the evolution of new genes and old ideas // Annual

Review of Genetics. 2004. Vol. 38. P. 615–643.

Tuskan G. A., Difazio S., Jansson S. et al. The genome of black cottonwood, Populus trichocarpa

(Torr. & Gray) // Science. 2006. Vol. 313. P. 1596–1604.

Vision T. J., Brown D. G., Tanksley S. D. The origins of genomic duplications in Arabidopsis // Sci-ence. 2000. Vol. 290. P. 2114–2117.

Wang Y., Gu X. Evolutionary patterns of gene families generated in the early stage of vertebrates //

Journal of Molecular Evolution. 2000. Vol. 51. P. 88–96.

Wolfe K. Robustness — It’s not where you think it is // Nature Genetics. 2000. Vol. 25. P. 3–4.

Wolfe K. H., Li W. H. Molecular evolution meets the genomics revolution // Nature Genetics. 2003.

Vol. 33 Suppl. P. 255–265.

Wong S., Butler G., Wolfe K. H. Gene order evolution and paleopolyploidy in hemiascomycete

yeasts // Proceeding of the National Academy of Sciences of USA. 2002. Vol. 99. P. 9272–

9277.

The Origin of Novel Proteins by Gene Duplication

G. A. Zhouravleva

Department of Genetics and Breeding St. Petersburg State University

St. Petersburg, Russia: zhouravleva@rambler. ru

Duplications of genes play a dominating role in creation of new genes. It is wide accepted, that whole genome duplication (instead of its separate parts) is more important for evolution. In the latter case an occurrence of regulator disbalance because of partial duplication of genome regulatory elements is possible. It is known, that genome polyploidization occured during evolutionary history of all of four eukariotic kingdoms: plants, animal, fungus and protista. Preservation of duplicated copies in evolution can be provided by one of three processes: 1) neofunctionalization; 2) subfunctionalization;

3) conservation. Neofunctionalization also includes a formation of “chimeric” or fused genes. This process is known as a block-modular gene reorganizations. This phenomenon becomes possible owing to duplication of all gene or its part since only in this case it will not lead to perturbation of function of an initial gene. Now assign three types of gene fami — lies’ evolution. Among them are two most simple types — divergence and the coordinated evolution. At the third process named “the birth and death of genes” are combined first two ways.

Keywords: duplication, divergence, evolution, polyploidization, neofunctionalization, subfunctionalization.

Материал взят из: Чарльз Дарвин и современная биология. Труды Международной научной конференции (21–23 сентября 2009 г., Санкт — Петербург)