warning: Invalid argument supplied for foreach() in /var/www/testshop/data/www/testshop.ru/includes/menu.inc on line 743.

Алгебраические свойства системы генетических алфавитов и гиперкомплексные числа. Элементы алгебраической биологии

Петухов С.В., доктор физико-математических наук, зав.лаборатории биомеханических систем Института машиноведения РАН

Представлены результаты исследования многоуровневой системы взаимосвязанных молекулярно-генетических алфавитов на основе применения матричных методов теории помехоустойчивого кодирования. Эти исследования выявили связи данной системы алфавитов с гиперкомплексными числами1 (кватернионами Гамильтона, сплит-кватернионами Кокла и их расширениями), ортогональными системами функций Радемахера и Уолша, матрицами Адамара и др. Тем самым, система генетических алфавитов, общая для всех живых организмов, своими алгебраическими свойствами подсказывает новый – алгебраический – путь познания живой материи и развития алгебраической биологии, связанной с гиперкомплексными числами. Живая материя, обеспечивающая передачу наследственной информации по цепи поколений, является информационной сущностью, формально представимой глубоко алгебраичными принципами.

Введение

Достижения молекулярной генетики привели к новому пониманию самой жизни: «Жизнь есть партнёрство между генами и математикой» [Stewart, 1999]. Но какая именно математика является партнёром генетического кода?

Пытаясь нащупать такую математику, автор обратился к изучению многоуровневой системы взаимно связанных молекулярно-генетических алфавитов. На этом пути неожиданно обнаружились связи генетической системы с известными формализмами инженерно-математической теории помехоустойчивого кодирования информации: кронекеровским произведением матриц, ортогональными системами функций Радемахера и Уолша, таблицами умножения 8-мерных гиперкомплексных числовых систем, матрицами Адамара и т. д. [Петухов, 2008; Petoukhov, 2011; Petoukhov, He, 2010]. Настоящая статья посвящена некоторым результатам такого изучения феноменологической системы взаимно связанных генетических алфавитов. Вообще алфавиты играют базисную роль в технологиях коммуникации. В любой коммуникационной системе «передатчик–приёмник» приёмник всегда знает алфавит сигналов, который использует передатчик для сообщений. В лингвистике (индо-европейские языки) алфавиты обычно имеют многоуровневую структуру, поскольку содержат подмножества гласных, согласных звуков, причём подмножество гласных состоит из подмножеств долгих и кратких гласных, а подмножество согласных – из подмножеств звонких и глухих согласных и т. д. Количества членов во всех этих частях лингвистических алфавитов не связаны друг с другом какими-либо известными алгебраическими закономерностями. Нами обнаружено, что в многоуровневой системе генетических алфавитов ситуация существенно иная: многие части этой системы тесно взаимосвязаны посредством содержательных алгебраических закономерностей и формализмов, которые широко известны в математике и технике связи, как упомянуто выше.

Молекулярно-генетическая система живого вещества содержит следующие алфавиты, каждый из которых может быть рассмотрен как отдельный алфавит или как часть сложной алфавитной системы:

4-буквенный алфавит азотистых оснований;

64-буквенный алфавит триплетов;

2-буквенный алфавит «слабых» и «сильных корней» триплетов;

20-буквенный алфавит аминокислот;

2-буквенный алфавит пуринов и пиримидинов;

2-буквенный алфавит сильных и слабых водородных связей;

2-буквенный алфавит «кето и амино» и т.д. (см. расширенный список генетических алфавитов в статье [Karlin, Ost, Blaisdell, 1989]).

С учётом этого молекулярно-генетическая система является полиязычной. Любая последовательность азотистых оснований в молекулах наследственности ДНК и РНК может читаться как полиязычное послание, интерпретируемое в зависимости от настройки считывающего устройства на тот или иной алфавит и потому несущее сразу несколько посланий на разных языках. Можно добавить, что распространённое выражение «генетический код» означает взаимосвязь между элементами двух из перечисленных алфавитов: алфавита триплетов и алфавита аминокислот и стоп-кодонов.

Генетическая информация, записанная на уровне микромира генетических молекул, диктует конструкции в макромире живых организмов в условиях сильных шумов и помех. Закон Менделя независимого наследования различительных признаков (например, цвета волос, кожи и глаз наследуются независимо друг от друга) свидетельствует о том, что этот диктат реализуется через различные независимые каналы передачи информации посредством неизвестных алгоритмов многоканального помехоустойчивого кодирования. Соответственно, каждый организм предстаёт в виде некой алгоритмической машины многоканального помехоустойчивого кодирования. Для её познания следует использовать теорию помехоустойчивого кодирования.

Матричные представления генетических алфавитов

Теория помехоустойчивого кодирования базируется на матричных методах. Например, матричные методы позволяют передавать качественные фотографии поверхности Марса на Землю через миллионы километров сильнейших помех. Для этих целей используются, в частности, кронекеровские семейства матриц Адамара (рис. 1).

 

Алгебраические свойства системы генетических алфавитов и гиперкомплексные числа. Элементы алгебраической биологии

Рис. 1. Начальные матрицы Адамара из семейства (2nх2n)-матриц Адамара, основанного на кронекеровских степенях (n) базовой матрицы H2 этого семейства. Символ (n) означает кронекеровскую (или тензорную) целую степень

 

Кронекеровское (или тензорное) произведение матриц является обычной операцией в технике обработки сигналов, теоретической физике и пр. Оно используется для перехода от пространств с меньшей размерностью к ассоциированным пространствам более высокой размерности. По аналогии с приёмами теории связи мы представляем 4-буквенный алфавит азотистых оснований A, C, G, T/U (аденин, цитозин, гуанин, тимин/урацил) в форме квадратной матрицы [C T; A G] (рис. 2). Этот 4-буквенный алфавит связан с 16-буквенным алфавитом генетических дуплетов и 64-буквенным алфавитом генетических триплетов посредством второй и третьей кронекеровской степени этой матрицы [C T; A G](2) и [C T; A G](3), которые дают (4х4)- и (8х8)-матрицы с упорядоченным расположением дуплетов и триплетов в них (см. рис. 2).

Обратимся теперь к алфавиту сильных и слабых корней триплетов. Две первые позиции каждого триплета называются его «корнем». Если все 4 триплета с одинаковым корнем кодируют одну и ту же аминокислоту, то такой корень называется «сильным» (например, CGC, CGA, CGT, CGG кодируют одну аминокислоту Arg). В противном случае корень называется «слабым». Природа почему-то поделила множество 64 триплетов на два равных подмножества по 32 триплета в каждом: первое подмножество содержит 32 триплета с сильными корнями (CC, CT, CG, AC, TC, GC, GT, GG), а второе – 32 триплета со слабыми корнями (CA, AA, AT, AG, TA, TT, TG, GA) (см. рис. 2 и 3).

 

Алгебраические свойства системы генетических алфавитов и гиперкомплексные числа. Элементы алгебраической биологии

Рис.2.Генетическая (2х2)-матрица [C T; A G] азотистых оснований и геноматрицы её второй и третьей кронекеровских степеней, содержащие упорядоченные множества 16 дуплетов и 64 триплетов. Чёрным выделены триплеты с сильными корнями и дуплеты, соответствующие таким корням (пояснение в тексте)

 

Алгебраические свойства системы генетических алфавитов и гиперкомплексные числа. Элементы алгебраической биологии

Алгебраические свойства системы генетических алфавитов и гиперкомплексные числа. Элементы алгебраической биологии

Рис. 3. Подмножества триплетов с сильными (слева) и слабыми корнями в «универсальном» генетическом коде и коде митохондрий человека и позвоночных. Исходные данные взяты c сайта Национального биоинформационного общества США (www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi)

 

Как этот 2-буквенный алфавит сильных и слабых корней сопряжён с 16-буквенным алфавитом дуплетов и 64-буквенным алфавитом триплетов? Существует ли, например, симметрия в расположении триплетов с сильными и слабыми корнями в матрице триплетов [C T; A G](3) , которая была построена совершенно формально без упоминания аминокислот и пр.? Заметим, что имеется огромное количество (64! ≈ 1089) вариантов расположения 64 триплетов в (8x8)-матрице. Для сравнения, физика оценивает всё время существования Вселенной в 1017 секунд. Очевидно, что случайное расположение 20 аминокислот и соответствующих триплетов в (8x8)-матрице почти никогда не даст симметрии в её половинах, квадрантах и строках. Но неожиданно феноменологическое расположение 32 триплетов с сильными корнями и 32 триплетов со слабыми корнями имеет в этой (8х8)-геноматрице симметрический характер, как и расположение соответствующих сильных и слабых дуплетов в (4х4)-геноматрице [C T; A G](2) (см. рис. 2): 1) оба квадранта вдоль каждой диагонали тождественны по мозаике; 2) верхняя и нижняя половины в каждой матрице зеркально-антисимметричны друг другу по цвету.

Какие математические секреты генетической системы отражены в этих мозаичных генетических матрицах взаимно сопряжённых генетических алфавитов? Наиболее важным фактом оказывается то, что мозаичный характер каждого столбца в каждой из этих двух геноматриц соответствует нечётной меандровой функции. Такие нечётные меандровые функции хорошо известны в теории обработки сигналов под именем «функций Радемахера». Функции Радемахера содержат только элементы «+1» и «-1». Каждый из столбцов в этих геноматрицах представляет одну из функций Радемахера, если каждый чёрный (белый) дуплет и триплет в них интерпретировать как элемент +1 (−1).

При этом получаются соответствующие радемахеровские представления R4 матрицы дуплетов [C T; A G](2) и R8 матрицы триплетов [C T; A G](3). Рис.4 показывает эти представления, а также их диадо-сдвиговую декомпозицию на четыре (c0, c1, c2, c3) и восемь (r0, r1, r2, r3, r4, r5, r6, r7) разреженных матриц, соответственно. Матрицы c0 и r0 являются единичными.

 

Алгебраические свойства системы генетических алфавитов и гиперкомплексные числа. Элементы алгебраической биологии

Алгебраические свойства системы генетических алфавитов и гиперкомплексные числа. Элементы алгебраической биологии

Алгебраические свойства системы генетических алфавитов и гиперкомплексные числа. Элементы алгебраической биологии

Рис. 4. Вверху: радемахеровские представления R4 и R8 геноматриц дуплетов и триплетов [C T; A G](2) и [C T; A G](3) (рис. 2). Знаки «+» и «-» обозначают элементы «+1» и «-1». Внизу: диадо-сдвиговая декомпозиция каждого из этих радемахеровских представлений R4 и R8 в виде сумм из 4 и 8 разреженных матриц, соответственно

 

Автором обнаружено, что каждый из этих наборов из 4 и 8 разреженных матриц замкнут относительно умножения (произведение любых двух матриц из набора даёт матрицу из того же набора с точностью до знака) и определяет свою собственную таблицу умножения (рис. 5).

 

Алгебраические свойства системы генетических алфавитов и гиперкомплексные числа. Элементы алгебраической биологии

Рис. 5. Таблицы умножения для набора разреженных матриц из декомпозиций на рис. 4. Слева: для радемахеровского представления R4 геноматрицы дуплетов [C T; A G](2). Справа: для радемахеровского представления R8 геноматрицы триплетов [C T; A G](3)

 

Таблица умножения на рис. 5 слева совпадает с таблицей умножения 4-мерной алгебры сплит-кватернионов Дж. Кокла (J. Cockle), открытой им в 1849 году и имеющей ряд приложений в физике [http://en.wikipedia.org/wiki/Split-quaternion]. Например, она используется в дисковой модели Пуанкаре геометрии Лобачевского. Таким образом, геноматрица дуплетов [C T; A G](2) в её радемахеровской форме R4 (см. рис. 4) представляет собой сплит-кватернион Кокла с единичными координатами. Радемахеровская форма R8 связана с радемахеровской формой R4 через кронекеровское умножение последней на матричную форму представления двойного числа (числа Лоренца) с единичными координатами

 

Алгебраические свойства системы генетических алфавитов и гиперкомплексные числа. Элементы алгебраической биологии

 

Соответственно, 8-мерная алгебра с таблицей умножения на рис. 5 справа может называться алгеброй бисплит-кватернионов Кокла, а геноматрица триплетов [C T; A G](3) в её радемахеровском представлении R8 (см. рис.4) оказывается бисплит-кватернионом Кокла с единичными координатами.

Подчеркнём, что представленные на рис.4 декомпозиции радемахеровских геноматриц R4 и R8 сопряжены с понятиями диадических сдвигов, диадических групп и матриц диадических сдвигов, играющих важную роль в компьютерных технологиях [Ахмед, Рао, 1980; Harmuth, 1980, §1.2.6]. Эти декомпозиции, производимые по образу матриц диадических сдвигов, мы называем диадо-сдвиговыми. Бисплит-кватернионы имеют много интересных математических свойств, ряд из которых может использоваться для математических моделей в биологии [Petoukhov, 2011].

Генетические матрицы Адамара

Теперь покажем, что свойства генетических алфавитов связывают генетическую систему со специальным подсемейством матриц Адамара, которые являются одним из наиболее известных инструментов в технике обработки сигналов.

4-буквенный алфавит азотистых оснований A, C, G, T/U имеет следующие две особенности, связанные с уникальным статусом тимина T (или урацила U): 1) каждое из трёх оснований A, C, G имеет функционально важную аминогруппу NH2, а четвёртое основание T/U не имеет её; 2) буква T – единственное основание в ДНК, которое заменяется при переходе к РНК на другое основание U.

С учётом этого уникального статуса буквы T/U нами выявлен следующий «T/U-алгоритм», который может использоваться в компьютерах организмов и который трансформирует символьные (4х4)- и (8х8)-матрицы дуплетов и триплетов [C T; A G](2) и [C T; A G](3) в (4х4)- и (8х8)-матрицы Адамара H4 и Н8 (рис. 6). Данный Т/U-алгоритм состоит из двух шагов: 1) каждый из мультиплетов в чёрно-белых (4х4)- и (8х8)-геноматрицах на рис. 2 изменяет свой цвет всякий раз, когда буква T стоит на нечётной позиции (например, стоит в триплете на первой или третьей позиции); 2) затем чёрные и белые дуплеты и триплеты в каждой из так полученных мозаичных матриц [C T; A G](2) и [C T; A G](3) интерпретируются как элементы «+1» и «-1», соответственно.

 

Алгебраические свойства системы генетических алфавитов и гиперкомплексные числа. Элементы алгебраической биологии

Рис.6. Вверху: символьные мозаичные матрицы дуплетов и триплетов [C T; A G](2) и [C T; A G](3), мозаика которых получена с помощью первого шага T/U-алгоритма из мозаики этих матриц на рис. 2. Внизу: адамаровы представления Н4 и Н8 этих геноматриц дуплетов и триплетов [C T; A G](2) и [C T; A G](3), получаемые с помощью второго шага T/U-алгоритма (пояснение в тексте)

 

Матрицей Адамара порядка «n» называется (nхn)-матрица Hn с элементами «+1» и «-1», которая удовлетворяет условию HnхHnT = nхIn, где HnT – транспонированная матрица, In – единичная матрица. Легко проверить, что полученные геноматрицы Н4 и Н8 (см. рис. 6) удовлетворяют этому определяющему условию: H4хH4T = 4хI4, H8хH8T = 8хIn, то есть являются матрицами Адамара.

Столбцы или строки матриц Адамара образуют полную ортогональную систему функций Уолша. Приложениям матриц Адамара в технике обработки сигналов посвящены десятки тысяч публикаций: помехоустойчивое кодирование, сжатие информации, и т. д. [Seberry, Wysocki, 2005]. Например, помехоустойчивые коды на основе матриц Адамара использовались на космических кораблях «Маринер» и «Вояджер», что позволило получить качественные фотографии Марса, Юпитера, Сатурна, Урана и Нептуна, несмотря на искажённость и ослабленность приходящих сигналов. Матрицы Адамара используются для создания квантовых компьютеров, которые базируются на «гейтах Адамара». В качестве унитарных операторов они применяются в квантовой механике. Поэтому связь матриц Адамара с системой помехоустойчивого генетического кодирования представляется весьма интересной.

Осуществим диадо-сдвиговые декомпозиции генетических матриц Адамара Н4 и Н8 по аналогии с декомпозициями радемахеровских матриц R4 и R8. В результате возникают два новых набора из четырёх (q0, q1, q2, q3) и восьми разреженных матриц (h0, h1, h2, h3, h4, h5, h6, h7), показанные на рис.7.

 

Алгебраические свойства системы генетических алфавитов и гиперкомплексные числа. Элементы алгебраической биологии

Рис. 7. Диадо-сдвиговые декомпозиции геноматриц Адамара Н4 и Н8 из рис.6

 

Каждый из этих двух наборов из 4 и 8 разреженных матриц неожиданно также оказывается замкнутым относительно умножения и определяет свою таблицу умножения, показанную на рис.8.

 

Алгебраические свойства системы генетических алфавитов и гиперкомплексные числа. Элементы алгебраической биологии

Рис.8. Таблицы умножения для наборов из 4 и 8 разреженных матриц на рис.7 (матрицы q0 и h0 – единичные) для геноматриц Адамара Н4 и Н8. Левая таблица совпадает с таблицей умножения 4-мерной алгебры кватернионов Гамильтона, а правая – с таблицей умножения 8-мерной алгебры бикватернионов Гамильтона

 

Левая из этих таблиц совпадает с таблицей умножения кватернионов Гамильтона, а правая – с таблицей умножения 8-мерной алгебры бикватернионов Гамильтона, которые в математике обычно определяются как кватернионы Гамильтона над полем комплексных чисел. В этой связи геноматрица Адамара Н4 оказывается кватернионом Гамильтона с единичными координатами, а геноматрица Адамара Н8 – бикватернионом Гамильтона с единичными координатами. Между этими двумя геноматрицами Адамара Н4 и Н8 имеется алгебраическая связь через кронекеровское умножение матрицы Н4 на матричное представление комплексного числа с единичными координатами:

 

Алгебраические свойства системы генетических алфавитов и гиперкомплексные числа. Элементы алгебраической биологии

 

Наше трёхмерное физическое пространство почему-то устроено так, что соответствует по своим геометрическим особенностям кватернионам Гамильтона. А теперь оказывается, что и система генетического кодирования почему-то устроена в соответствии с кватернионами и бикватернионами Гамильтона. Кватернионы Гамильтона тесно связаны с матрицами Паули, теорией электромагнитного поля (Максвелл написал свои уравнения именно на языке кватернионов Гамильтона), специальной теорией относительности, теорией спинов, квантовомеханической теорией химической валентности и пр. Кватернионам в физике только в ХХ веке посвящены тысячи работ [http://arxiv.org/abs/math-ph/0511092]. Матричная генетика привела к открытию важного моста между физикой, биологией и информатикой для их взаимного обогащения.

Кватернионы Гамильтона известны как инструмент математики и физики. Нами обращается внимание на то, что кватернион Гамильтона с единичными координатами через его матричные представления (а существует не одно такое представление) оказывается глубоко связанным с информатикой в силу двух причин: 1) его (4х4)-матричные представления являются матрицами Адамара; 2) размещение координат четырёх видов в любых его (4х4)-матричных представлениях всегда соответствует упомянутому принципу диадических сдвигов, основанному на одной из основных операций компьютерных технологий – сложении бинарных чисел по модулю 2.

Названные кватернион и бикватернион Гамильтона с единичными координатами, будучи нормированы на единичный детерминант, образуют при возведении в степени циклические группы с периодами 6 и 24, соответственно: (2-1хН4)n=(2-1хН4)n+6; (2-1.5хH8)n=(2-1.5хH8)n+24.

Свойства этих циклических групп таковы, что позволяют использовать их для моделирования генетически наследуемых свойств живых организмов. Например, покажем совпадение свойств генетически наследуемого цветовосприятия с 6-членной циклической группой кватерниона Гамильтона (2-1хН4)n. Изобразим все члены этой циклической группы на круговом циферблате (чёрные ячейки матриц содержат числа «+0,5», белые – «-0,5»; Е – единичная матрица) (рис .9). Эта 6-членная группа кватернионов Гамильтона имеет следующие свойства:

1) противолежащие на круге кватернионы противоположны по знаку и при сложении дают ноль, а потому являются взаимно дополнительными;

2) каждый кватернион на круге представляет собой сумму двух соседних;

3) сумма кватернионов в вершинах каждого из двух треугольников «звезды Давида» равна нулю.

Эти свойства циклической группы реперного кватерниона Гамильтона тождественны феноменологическим свойствам наследуемого цветовосприятия. Последнее основано на трёх базовых цветах (красный, синий, зелёный) и трёх дополнительных к ним (голубой, жёлтый, пурпурный), лежащих в вершинах двух треугольников «звезды Давида» на цветовом круге Ньютона:

1) противолежащие на круге цвета взаимно дополнительны и при наложении гасят друг друга;

2) каждый цвет на круге представляет собой сумму двух соседних цветов;

3) три базовые цвета, как и три дополнительные цвета, при наложении гасят друг друга.

 

Алгебраические свойства системы генетических алфавитов и гиперкомплексные числа. Элементы алгебраической биологии

Рис. 9. Цветовой круг Ньютона из психофизики цветовосприятия и соответствие ему членов циклической группы нормированного кватерниона Гамильтона с единичными координатами Qn = (0.5хН4)n, период которой равен 6

 

Задачу о смешении цветов теперь формально можно решать на языке циклической группы кватерниона Гамильтона, если закрепить за каждым цветом член этой группы в соответствии с рис. 9. Например, какой цвет получится, если смешать 3 доли красного цвета, 2 доли жёлтого и 5 долей синего? Ответ получается сложением соответствующих кватернионов: 3Q1 + 2Q6 + 5Q3 = 3Q2, то есть 3 доли пурпурного (здесь использовано обозначение Q = 0,5хН4).

В психофизике известно, что цвет – это не физическое свойство объекта, а наследуемая реакция человека на поступающее от объекта световое воздействие с учётом общего светового окружения. Почему же наше цветовое восприятие устроено именно в соответствии с цветовым кругом и циклической группой кватернионов Гамильтона? Возможный ответ: потому что организм обрабатывает световую информацию на основе наследуемых единых алгоритмов обработки генетической и физической информации с участием генетически наследуемой циклической группы кватернионов Гамильтона, с которой связана сама система генетических алфавитов.

Свойства указанной выше циклической группы бикватерниона Гамильтона с периодом 24 позволяют использовать её для математического моделирования в области проблематики 24-часовых биоритмов суток, тем более, что бикватернионы в физике используются для моделирования пространственно-временных отношений. Как известно, наш организм представляет собой огромный хор генетически наследуемых ритмических процессов. Даже белки циклически распадаются на аминокислоты и собираются вновь. Фазы активности и пассивности физиологических систем согласованы между собой и, по представлениям древней и современной медицины, обусловливают деление человеком суток на 24 часа. Биоритмическая организация наследуемых процессов распределена по всему телу организмов самых различных видов, в том числе не обладающих нервной системой. Биоритмология важна для медицины, эргономики и пр. (см., например, [Райт, 2003]).

 

Алгебраические свойства системы генетических алфавитов и гиперкомплексные числа. Элементы алгебраической биологии

Рис. 10. 24-часовой циферблат суток с их делением на дневную и ночную 12-часовые половины

 

Рис. 10 показывает 24-часовой циферблат, в котором числа соответствуют показателям степени этого нормированного бикватерниона (B = 2-1.5хH8) с единичными координатами. Бикватернионы в степенях, противолежащих на циферблате, отличаются только противоложным знаком (Bn = -Bn+12) по аналогии с противоположностью дневных и ночных часов (например, в обычной жизни вместо «14 часов» зачастую говорят «2 часа дня», называя противолежащее на этом циферблате число).

На основе выявленных связей системы генетических алфавитов с описанными в статье гиперкомплексными числами автором устанавливаются новые количественные и симметрологические правила организации длинных секвенций нуклеотидов (в дополнение к известному «второму правилу Чаргафа»). Одновременно полученные результаты выводят на новые средства анализа генетически наследуемых физиологических процессов. Речь идёт об использовании названных геноматриц Адамара в связи с плодотворной секвентной теорией Х.Хармута обработки сигналов [1970, 1977, 1981, 1989]. Она эффективно используется в телекоммуникациях, радарной технике и пр. Генетические матрицы Адамара определяют специальные варианты секвентного спектрального анализа, пространственной и временнóй фильтрации физиологических процессов и их корреляционного анализа. Данные развиваемой «матричной генетики» позволяют полагать, что этот «генетический» секвентный анализ может послужить ключом к важным аспектам биоинформатики.

Например, существует бесконечно много видов спектрального анализа, поскольку существует бесконечно много ортогональных систем функций. Какой же вид спектрального анализа выбрать для генетически наследуемых физиологических систем и процессов в них? Существует целый ряд аргументов в пользу того, что здесь следует развивать и применять именно «геносеквентный» анализ на основе ортогональных систем функций Уолша, представленных в геноматрицах Адамара. В частности, этот анализ на несинусоидальных волнах пригоден для анализа систем, меняющихся во времени, к которым относятся биологические системы. Для сравнения напомним, что спектральный анализ Фурье на основе тригонометрических функций пригоден только для линейных систем, инвариантных во времени.

Полученные результаты заставляют автора не соглашаться с известным утверждением: «Энциклопедия Жизни написана 4 буквами». Это утверждение скрывает ключевую роль многоуровневой системы сопряжённых генетических алфавитов. Много более верным выглядит следующее утверждение: «Энциклопедия Жизни написана сплетением многих взаимосвязанных алфавитов, имеющим алгебраическую основу».

В силу единства организма структурные аналогии с устройством системы молекулярно-генетических алфавитов можно искать на более высоких уровнях генетической организации. Например, автор отмечает, что известные квадратные таблицы (или решётки) Пеннета, используемые в генетике с 1905 года в задачах о наследовании доминантных и рецессивных признаков при полигибридном скрещивании, имеют аналогии с кронекеровскими семействами квадратных геноматриц мультиплетов. Эти таблицы Пеннета можно облегчённым образом строить на основе кронекеровского умножения таблиц Пеннета для моногибридного скрещивания, если последние трактовать как (2х2)-матрицы, компонентами которых выступают комбинации аллелей материнских и отцовских гамет. Представляется, что Мендель открыл верхушку огромного алгебраического айсберга организации живой материи, а наши результаты открывают новые части этого айсберга.

Дополнительно отметим, что система генетических алфавитов сопряжена с символьной системой древнекитайской «Книги Перемен», написанной несколько тысяч лет назад. Например, в этой древнекитайской системе базовое значение имеют четыре диграммы, именуемые как «Старый Ян, Старая Инь, Молодой Ян и Молодая Инь». По аналогии с генетическим алфавитом из этих диграмм можно сконструировать квадратную матрицу, третья кронекеровская степень которой порождает знаменитую таблицу 64 гексаграмм порядка Фу-си их этой древнекитайской книги [Петухов, 2008; Petoukhov, He, 2010; Petoukhov, 2011]. Древние китайцы утверждали, что их система является всеобщим природным архетипом и универсальной классификационной схемой. Они ничего не знали о генетическом коде, но генетический код оказывается сконструированным во многом в соответствии с этой древней системой.

 

Алгебраические свойства системы генетических алфавитов и гиперкомплексные числа. Элементы алгебраической биологииАлгебраические свойства системы генетических алфавитов и гиперкомплексные числа. Элементы алгебраической биологии

Рис.11. Китайский зодиакальный круг из 12 животных (из [Лиллиан Ту, 1999])

 

Существует много других аналогий между генетической системой и системой «Книги Перемен». Так, если вернуться к последнему соотношению и рис. 10 и рассматривать чётные (т.е. инь-числовые) степени нормированного бикватерниона Гамильтона В2n (или нечётные, т.е. ян-числовые степени В2n+1), то получаем циклическую группу с периодом 12, которая по своим свойствам аналогична китайскому кругу знаков Зодиака в виде 12 животных (рис. 11) с их особыми взаимоотношениями: 1) животные в каждой паре, размещённой на круге напротив друг друга, антагонистичны; 2) три вида животных в каждой тройке в вершинах каждого из треугольников совместимы или взаимно дополнительны (рис. 11 справа). Но аналогичными взаимными связями обладают члены названной 12-периодической циклической группы бикватерниона Гамильтона: 1) члены, противостоящие в этой группе, отличаются только противоположным знаком (B2n = -B2n+6); 2) члены этой группы бикватернионов, расположенные в вершинах аналогичных треугольников, в сумме дают ноль, то есть являются взаимно дополнительными (B2n + B2(n+4) + B2(n+8) = 0).

В начале статьи было отмечено, что живой организм является алгоритмической машиной многоканального помехоустойчивого кодирования, которая реализует законы Менделя – независимого наследования признаков и пр. Представляется, что нами открыты некоторые важные алгебраические основы этой алгоритмической генетической «машины», которые свидетельствуют о глубокой алгебраической природе генетической системы. Данные результаты ведут к развитию алгебраической биологии. Система генетических алфавитов своими алгебраическими особенностями подсказывает новый – алгебраический – путь к познанию живой материи.

 

С.В.Петухов, доктор физико-математических наук, зав. лаборатории биомеханических систем Института машиноведения РАН

spetoukhov@gmail.com

 

Примечание
Список литературы
Идентификация
  

или

Я войду, используя: