Курс лекций Математические модели в естествознании 1996 г. 1
Часть 1 Основы математической генетики 2
Законы Менделя 4
Закон Харди- Вайнберга 7
Курс лекций
Математические модели в естествознании
1996 г.
Работа над любой математической моделью начинается со сбора и анализа
фактического материала. Определяются цели моделирования. Выделяются главные
черты изучаемого объекта или явления. Вводятся формализованные
характеристики. Принимаются правила работы с ними. В результате возникает
математический объект, который и называется математической моделью.
Разрабатываются методы математического анализа модели, которыми она
исследуется. Полученные результаты математического моделирования
интерпретируются в рамках исходного фактического материала, что позволяет
оценить степень адекватности модели. Результаты моделирования не должны
противоречить выделенным ранее ключевым экспериментальным фактам.
Одновременно, модель не может объяснить все стороны изучаемого объекта или
явления.
Хорошая модель, кроме объяснения известных, должна давать возможность
предсказывать новые свойства. Математическое моделирование широко
используется там, где экспериментальные исследования трудоемки и
дорогостоящи, или вообще невозможны (например, в изучении социальных
явлений).
Кроме задачи о прогнозе, математическое моделирование помогает
классифицировать и систематизировать фактический материал, увидеть
существующие связи в мозаике фактов. Это вытекает из того, что модель
является специфическим -ярким и выразительным языком, предназначенным для
описания для описания изучаемого объекта или явления.
Мир математических моделей разнообразен. Существуют различные схемы
их классификации. Однако, каждая модель конкретна и предназначена для
описания достаточно узкого круга объектов и явлений. Это накладывает
определенный отпечаток на предлагаемый лекционный курс. Он включает в себя
модели. относящиеся к различным областям естествознания. Модели сильно
отличаются друг от друга не только предметными областями, но математической
терминологией, а также математическими методами их исследования.
Предпочтение отдается более простым моделям. Отметим, что "простота"
(иногда в ущерб точности)-один из принципов, о котором всегда нужно помнить
при разработке математической модели.
Часть 1
Основы математической генетики
В 1865 г. чешский монах Грегор Мендель опубликовал работу о
результатах скрещивания разновидностей гороха. В своих опытах Г. Мендель
изучал закономерности наследования семи пар альтернативных признаков. В
одном из опытов перекрестно скрещивались растения с гладкими и сморщенными
семенами. В результате такого скрещивания в первом поколении все растения
имели гладкие семена. Проявляющиеся признаки Г.Мендель назвал доминантными,
а не проявляющиеся - рецессивными. Растениям, полученным в первом
поколении, была предоставлена возможность самоопыляться. Во втором
поколении появились как гладкие, так и сморщенные горошины. При подсчете
выяснилось, что 5 474 горошины были гладкими, а 1 850 - морщинистыми. Доля
гладких горошин оказалась близкой к 3/4, а морщинистых - к 1/4. Отношение
близко к 3:1. Во всех других опытах для каждой пары альтернативных
признаков (например, цвет горошин) доминантный признак обнаруживался
примерно втрое чаще рецессивного. Для объяснения результатов опытов
Г.Мендель предположил, что внешние признаки определяются некоторыми
внутренними факторами (генами), которые могут находиться в одной из двух
альтернативных форм (теперь они называются аллелями). Были сделаны два
допущения.
1. Два фактора, определяющие данный признак, в течении жизни
организма сосуществуют независимо друг от друга, не сливаясь и не
растворяясь один в другом. Они расщепляются при формировании половых
клеток, которые возникают парами. Одна из половых клеток несет в себе один,
а другая - оставшийся фактор.
2. Гены, определяющие различные признаки, наследуются независимо.
Работа Г.Менделя была не понята и забыта его современниками. В 1900
г. результаты были открыты вновь. Началось развитие новой науки -генетики.
Согласно современным представлениям, носителями генов являются нитевидные
тела -хромосомы, которые располагаются в ядре клетки. Организмы,
относящиеся к различным биологическим видам имеют разную структуру и число
хромосом. У человека каждая клетка содержит 46 хромосом, у гороха -14.
Число хромосом четно. Каждая хромосома в клетке присутствует в двух
экземплярах, отличающихся, быть может только аллелями (вариантами, или
формами) генов. Такие пары хромосом называются гомологичными. Место,
занимаемое аллелью гена в хромосоме, называется локусом. Можно представить
хромосому как прямолинейный отрезок, а локусы как его последовательные
участки.
Половые клетки -гаметы возникают в результате процесса, который
называется мейозом. Гомологичные хромосомы расходятся в разные концы
клетки, и клетка делится пополам. Гаметы содержат половинный набор хромосом
(у человека 23). Зародышевая клетка -зигота образуется путем слияния
мужской и женской гамет и содержит полный набор хромосом. Из зиготы путем
обычного деления - митоза образуется новый организм. При митозе каждая
хромосома создает свою точную копию. Оригиналы и копии расходятся в разные
клетки. Набор генов каждой клетки называется генотипом организма. Описанная
схема упрощена. но в ней отражаются ключевые моменты, которые используются
при разработке математической модели.
Фенотипом называется совокупность всех внешних признаков организма.
Фундаментальный принцип генетики - при неизменных внешних условиях фенотип
организма определяется его генотипом. Некоторые признаки организма
определяются не всем не всем генотипом, а только его частью (в
экспериментах Г.Менделя - двумя аллелями одного гена). Пол человека
определяется двумя половыми хромосомами X и Y. Женская зигота содержит две
хромосомы X, мужская -хромосомы X и Y.
Мать передает своему ребенку одну из хромосом X. Отец передает дочери
хромосому X, а сыну - хромосому Y. Таким образом, пол ребенка зависит
только от отца.
Совокупность генотипов, у которых часть генных наборов одинакова,
называется популяцией (по данным наборам). Численность популяции считается
достаточно большой (бесконечной). Описывать популяцию будем набором частот
генотипов в данном поколении. Будем считать, что одно поколение сменяет
другое, т.е. поколения не перекрываются.
Законы Менделя
Рассмотрим рассуждения Г.Менделя, используя описанные выше термины.
За форму семян гороха отвечает двухаллельный ген. Его доминантную аллель
(фенотип -гладкие семена) обозначим как A, а рецессивную как a (сморщенные
семена). Генотип определяется парой аллелей. Возможны три генотипа: AA, Aa,
aa. Генотип Aa называется гетерозиготным, а генотипы AA, aa -гомозиготными.
Поскольку аллель A является доминантным, то растения первых двух генотипов
будут иметь гладкие семена, а третьего -морщинистые.
На первом этапе своего опыта Г.Мендель брал гомозиготные растения AA, aa. Первый тип давал гамета, имеющие аллель A, второму соответствовали
гаметы с аллелью a.
Скрещивание гомозиготных растений AA и aa (слияние гамет A и a) дает
гетерозиготное растение Aa. Последнее дает гаметы, несущие аллели A и a.
Какую из двух аллелей получит конкретная гамета -дело случая и вероятность
каждого из событий 1/2.
На втором этапе опыта Г.Менделя скрещивались гетерозиготные растения.
Генотип AA у потомка имеет место, если каждый из родителей передал гамету с
аллелем A. События независимые. Вероятность P(AA) потомка с генотипом AA
равна 1/4. Аналогично, вероятность P(aa) появления потомка aa также 1/4.
Вероятность появления потомка с генотипом Aa можно вычислить по дополнению:
P(Aa)=1-1/4-1/4=1/2. Вероятность того, что растение -потомок двух
гетерозиготных родителей будет иметь гладкие семена:
P(AA)+P(Aa)=1/4+1/2=3/4. Морщинистые семена будут наблюдаться с
вероятностью P(aa)=1/4.
Такова математическая модель, объясняющая опыты Г.Менделя. Обсудим
вопрос об ее адекватности. Напомним, что в опытах соответствующие частоты
наблюдались приближенно. Это задача о проверке статистической гипотезы. Для
проверки можно использовать критерий Пирсона.
Предположим, что мы наблюдаем серию из n независимых испытаний.
Каждое из них может завершиться одним из m исходов [pic]. Вероятности
исходов [pic] не меняются от испытания к испытанию. Подлежащая проверке
нуль -гипотеза состоит в том, что эти вероятности равны некоторым заранее
заданным числам: [pic]. Относительно числа n предполагается. что оно
достаточно велико. Пусть [pic] -полученные в результате опыта эмпирические
частоты наступления исхода [pic]. Составляется сумма:
[pic],
которая часто называется суммой Пирсона. Оказывается, что с ростом n
распределение статистики S стремится к предельному распределению [pic] с m-
1 степенями свободы, не зависящему ни от n, ни от чисел [pic]. Для любого
>0 можно указать практическую границу [pic] такую, что
[pic].
Другими словами, неравенство [pic]>[pic] практически невозможно. Число
называется уровнем значимости.
Зададимся уровнем значимости =0.05, который очень популярен в
биологии. В рассматриваемом случае число степеней свободы m-1=1.
Распределение суммы Пирсона для столь большого числа, как n=7 324
практически не отличается от [pic] распределения с одной степенью свободы.
По таблицам определяем [pic]3.84. Вычислим сумму Пирсона:
[pic]
Так как сумма Пирсона меньше [pic], то нуль- гипотеза хорошо согласуется с
результатами эксперимента. Получаем веские основания считать, что закон
Менделя справедлив.
В генетике развит некий формализм, позволяющий быстро выводить
закономерности. Аллельные пары представляют в виде:
[pic], [pic], [pic],
Скрещивание генотипов обозначается знаком '' -умножения. Скобки в формулах
раскрываются по привычным правилам и знаки умножения опускаются.
Скрещивание гетерозиготных растений описывается формулой:
[pic]
Полученная формула утверждает, что генотипы AA и aa возникают при
скрещивании с вероятностью 1/4, а генотип Aa с вероятностью 1/2. Так как
генотипы AA и Aa обладают гладкими семенами, то 3/4 потомства имеют гладкие
семена, а 1/4 - морщинистые семена (генотип aa).
Решим простую задачу о скрещивании генотипов Aa и aa:
[pic]
Таким образом, половина генотипов будет гетерозиготными, а половина
гомозиготными.
Большинство признаков генотипа контролируется более чем двумя
аллелями. Такие аллели называются множественными. Такие аллели в любом
непарном сочетании могут находиться в любой клетке, так как только две
аллели одного гена могут одновременно присутствовать в генотипе. Такие
генотипы называются диплоидными. Полиаллельными являются гены,
контролирующие группы крови. Группа крови человека зависит от присутствия
либо отсутствия в эритроцитах специфических белков (A и B). Существуют
четыре группы крови: Группа крови A с генотипами AA и AO (группа крови
содержит белок A), группа крови B с генотипами BB и BO (содержит белок B),
Группа крови AB (содержит оба белка), группа крови OO (отсутствие белков A
и B). Таким образом, группа крови контролируется тремя аллелями A, B, O
одного гена. Аллели A и B -доминанты по отношению к O. В присутствия
аллелей A и B доминантность отсутствует. Таким образом группы крови
определяются шестью генотипами AA, AO, AB, BB, BO, OO.
Закон Харди- Вайнберга
В законе Харди -Вайнберга речь идет о частотах генотипов в
популяциях. Этот закон сформулировали в 1908 г. независимо друг от друга
английский математик Дж.Харди и австрийский врач В.Вайнберг.
Рассматривалась следующая задача. Известны частоты генотипов в
двухаллельной популяции в нулевом поколении. Требуется проследить изменение
частот от поколения к поколению.
Двухаллельная популяция состоит из генотипов: AA, Aa, aa. Их частоты
в нулевом (начальном) поколении обозначим через u(0), 2v(0), w(0).
Естественно, что u(0)+2v(0)+w(0)=1. Скрещивание предполагается случайным.
Удобно следить за эволюцией частот с помощью следующей схемы.
Нулевое поколение
Генотипы Частоты генотипов AA u(0) Aa 2v(0) aa w(0)
Гаметы Частоты гамет A p(0)=u(0)+v(0) a q(0)= v(0)+w(0)
(менделевское формирование гамет)
Первое поколение
Генотипы Частоты генотипов[pic] AA [pic] [pic] Aa [pic] aa [pic]
Гаметы Частоты гамет A [pic] a [pic]
Таким образом, частоты гамет не меняются от поколения к поколению.
Дальнейшее скрещивание не меняет и частоту зигот.
Второе поколение
Генотипы Частоты генотипов[pic] AA [pic] [pic] Aa [pic] aa [pic]
Частоты зигот устанавливаются в первом поколении и больше не
меняются.
Закон Харди-Вайнберга состоит из следующих двух утверждений.
1. Частоты гамет (аллелей) не меняются от поколения к поколению.
2. Равновесные частоты генотипов достигаются за одно поколение. В
популяции поддерживается соотношение между гомозиготными и гетерозиготными
организмами:
[pic].
Закон Харди-Вайнберга распространяется на любое число аллелей [pic].
Очевидно, что число гомозигот [pic] суть m, а гетерозигот [pic]. Общее
число зигот будет [pic]. Рассуждения для многоаллельного случая полностью
аналогичны предыдущему.
Нулевое поколение
Генотипы Частоты генотипов [pic] [pic] [pic] [pic]
Гаметы Частоты гамет [pic] [pic]
Первое поколение
Генотипы Частоты генотипов[pic] [pic][pic] [pic] [pic] [pic]
Гаметы Частоты гамет [pic] [pic]
Таким образом, частоты гамет не меняются от поколения к поколению.
Дальнейшее скрещивание не меняет и частоту зигот.
Второе поколение
Генотипы Частоты генотипов[pic] [pic] [pic]
[pic] [pic]
Для всех последующих поколений частоты генотипов остаются такими же: [pic],
[pic]. Это и есть закон Харди -Вайнберга для полиаллельного локуса.
Обсудим некоторые аспекты закона Харди -Вайнберга. В случае
доминирования аллеля A над a наблюдаются лишь фенотипы {AA, Aa}, {a,a}. В
силу закона Харди -Вайнберга их вероятности равны
[pic]
где [pic] -частота рецессивного аллеля a.
Если рецессивный аллель -редкий ([pic]), то соответствующий фенотип
наблюдается еще реже. Частота наблюдения альбиносов (генотип aa, он же -
фенотип) [pic]. Это - экспериментальный факт. В силу закона Харди
-Вайнберга, скрытые носители рецессивного аллеля (генотип Aa) встречаются
гораздо чаще:
[pic].
Если доминантный аллель является редким: [pic], то частота его
проявления примерно вдвое больше:
[pic].
Интересная ситуация складывается сейчас в человеческой популяции.
Существуют рецессивные летальные аллели (генотип aa нежизнеспособен).
Примером может служить наследственная болезнь фенилкотонурия (ФКУ). Сейчас
найдены способы ее лечения. Выздоровевшие люди могут давать потомство и
передавать ему аллель ФКУ. Тем самым частота летальных генов будет
возрастать.
Сделаем некоторые замечания о математических аспектах закона Харди
-Вайнберга. Обозначим частоты генотипов AA, Aa, aa через [pic]. Здесь [pic]
и
[pic].
Эти соотношения выделяют в трехмерном пространстве треугольник. В следующем
поколении частоты [pic] выражаются через частоты [pic] по формулам:
[pic]
[pic] (1)
[pic]
Формулы задают отображение треугольника в себя, которое назовем оператором
эволюции и обозначим через V. Закон Харди -Вайнберга означает, что
[pic]. (2)
Эта формула отражает принцип стационарности, который С.Н. Бернштейн
возвел в ранг закона.
Основная проблема, которой занимался С.Н. Бернштейн, - выявление всех
законов наследования, подчиненных закону стационарности. Он дал ее полное
решение для популяций, состоящих из трех генотипов, а также изучил
некоторые случаи большего числа генотипов. Среди них пример популяции с m
-аллельным геном. Пусть его аллели [pic]. Генотипы популяции: [pic], при
этом [pic]. Обозначим частоты генотипов в текущем поколении через [pic].
Неотрицательные числа [pic] очевидно удовлетворяют соотношению:
[pic].
Пусть [pic] частоты генотипов в следующем поколении. Оператор эволюции
имеет следующий вид:
[pic]
[pic].
Из закона Харди -Вайнберга для полиаллельных популяций следует, что для
данного эволюционного оператора также выполнен принцип стационарности (2).
В одной из работ С.Н. Бернштейна рассматривался так называемый
кадрильный закон наследования, генетическая интерпретация которого
принадлежит Ю.И. Любичу. Введем два вида "женских " X, x и два вида
"мужских" ген Y, y. Будем считать, что могут существовать лишь четыре
генотипа: XY, xy, Xy, xY, которым присвоим номера 1, 2, 3, 4. Остальные
мыслимые комбинации генов запретим. Частоты генотипов в нулевом поколении
обозначим через [pic], а в следующем -через [pic]. Поскольку при
образовании зиготы объединяется одна женская и одна мужская гаметы, то
следует говорить о частотах гамет X и x среди женских и о частотах гамет Y
и y среди мужских. Частоты женских гамет в нулевом поколении: [pic], [pic] [pic].
Частоты мужских гамет: [pic] [pic] [pic].
Частоты генотипов в первом поколении:
[pic] [pic]
[pic] [pic].
Отсюда получаем:
[pic]
[pic]
[pic]
[pic]
Данное отображение и изучал С.Н. Бернштейн. Частоты генов в первом
поколении
[pic]
(аналогично для других частот), т.е. сохраняются.
С.Н. Бернштейн показал неизбежность концепции гена в условиях
Менделя. Сформулируем этот результат. Обозначим через [pic] вероятность
появления потомка [pic] у родителей [pic] и [pic]. Генотип [pic] называется
исчезающим, если появление потомка [pic] у любой пары родителей равно
нулю.
Теорема. Если в трехмерной популяции
[pic]
все генотипы не исчезающие и [pic], (при скрещивании первого со вторым
получается только третий), то популяция менделевская.
Вернемся еще раз к вопросу о группах крови. В 1925 г. Ф. Бернштейн
выдвинул гипотезу, что группа крови определяется тремя аллелями A, B, O
одного локуса с доминированием A и B над O (в случае присутствия A и B
доминантность отсутствует). Фенотипы: {AB}, {AO, AA}, {BO, BB}, {OO}.
Согласно закону Харди -Вайнберга для одного трехаллельного локуса имеем:
[pic]
[pic]
[pic]
[pic]
откуда вытекает соотношение:
[pic][pic]
Для населения Японии известны следующие статистические данные: [pic] [pic]
[pic] [pic]. Экспериментальное значение величины [pic], что хорошо
согласуется со статистическим прогнозом. Данное обстоятельство можно
интерпретировать в пользу гипотезы.