Агроэкологическое моделирование

электронный учебно-методический комплекс

МОДУЛЬ 2. Математическое моделирование

Тема 2.1. Понятие и основные процедуры (операции) математического моделирования

(лекция разработана по материалам Камышовой Г.Н., и Тереховой Н.Н., 2012)

МОДЕЛЬ – объект или описание объекта, системы для замещения (при определенных условиях, предположениях, гипотезах) одной системы (т.е. оригинала) другой системой для изучения оригинала или воспроизведения каких – либо его свойств.

МАТЕМАТИЧЕСКАЯ МОДЕЛЬ – это упрощенное описание реальности с помощью математических понятий.

Существует два основных класса задач, связанных с математическими моделями: прямые и обратные.

В первом случае все параметры модели считаются известными, и нам остается только исследовать её поведение.

Во втором какие-то параметры модели неизвестны (например, не могут быть измерены явно), и требуется их найти, сопоставляя поведение реальной системы с её моделью. Ещё одна обратная задача: подобрать параметры модели таким образом, чтобы она удовлетворяла каким-то заданным условиям - такие задачи требуется решать при проектировании систем.

Особую роль в науке играют математические модели. Строительный материал и инструменты этих моделей - математические понятия. Они накапливались и совершенствовались в течение тысячелетий. Современная математика дает исключительно мощные и универсальные средства исследования. Практически каждое понятие в математике, каждый математический объект, является математической моделью.

При построении математической модели, изучаемого объекта или явления выделяют те его особенности, черты и детали, которые с одной стороны содержат более или менее полную информацию об объекте, а с другой допускают математическую формализацию. Математическая формализация означает, что особенностям и деталям объекта можно поставить в соответствие подходящие адекватные математические понятия. Тогда связи и отношения, обнаруженные и предпо-лагаемые в изучаемом объекте между отдельными его дета-лями и составными частями можно записать с помощью математических отношений: равенств, неравенств, уравне-ний. В результате получается математическое описание изу-чаемого процесса или явление, то есть его математическая модель.

Изучение математической модели всегда связанно с некоторыми правилами действия над изучаемыми объектами. Эти правила отражают связи между причинами и следствиями.

Построение математической модели - это центральный этап исследования или проектирования любой системы. От качества модели зависит весь последующий анализ объекта. Построение модели - это процедура не формальная. Модель должна быть достаточно точной, адекватной и должна быть удобна для использования.

КЛАССИФИКАЦИЯ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ

Математические модели могут быть детерминированными и стохастическими.

Детерминированные модели - это модели, в которых установлено взаимнооднозначное соответствие между переменными описывающими объект или явления.

Такой подход основан на знании механизма функционирования объектов. Часто моделируемый объект сложен и расшифровка его механизма может оказаться очень трудоемкой и длинной во времени. В этом случае поступают следующим образом: на оригинале проводят эксперименты, обрабатывают полученные результаты и, не вникая в меха-низм и теорию моделируемого объекта с помощью методов математической статистики и теории вероятности, устанав-ливают связи между переменными, описывающими объект. В этом случае получают стахостическую модель. В ста-хостической модели связь между переменными носит слу-чайный характер, иногда это бывает принципиально. Воздействие огромного количества факторов, их сочетание приводит к случайному набору переменных описывающих объект или явление. По характеру режимов модель бывают статистическими и динамическими.

Статистическая модель включает описание связей между основными переменными моделируемого объекта в установившемся режиме без учета изменения параметров во времени.

В динамической модели описываются связи между основными переменными моделируемого объекта при переходе от одного режима к другому.

Модели бывают дискретными и непрерывными, а также смешанного типа. В непрерывных переменные принимают значения из некоторого промежутка, в дискретных переменные принимают изолированные значения.

Основные этапы математического моделирования

1. Постановка задачи.

Определение цели анализа и пути ее достижения и выработки общего подхода к исследуемой проблеме. На этом этапе требуется глубокое понимание существа поставленной задачи. Иногда, правильно поставить задачу не менее сложно чем ее решить. Постановка - процесс не формальный, общих правил нет.

2. Изучение теоретических основ и сбор информации об объекте оригинала.

На этом этапе подбирается или разрабатывается подходящая теория. Если ее нет, устанавливаются причинно - следственные связи между переменными описывающими объект. Определяются входные и выходные данные, принимаются упрощающие предположения.

3. Формализация.

Заключается в выборе системы условных обозначений и с их помощью записываются отношения между составляющими объекта в виде математических выражений. Устанавливается класс задач, к которым может быть отнесена полученная математическая модель объекта. Значения некоторых параметров на этом этапе еще могут быть не конкретизированы.

4. Выбор метода решения.

На этом этапе устанавливаются окончательные параметры моделей с учетом условия функционирования объекта. Для полученной математической задачи выбирается какой- либо метод решения или разрабатывается специальный метод. При выборе метода учитываются знания пользователя, его предпочтения, а также предпочтения разработчика.

5. Реализация модели.

Разработав алгоритм, пишется программа, которая отлаживается, тестируется и получается решение нужной за-дачи.

6. Анализ полученной информации.

Сопоставляется полученное и предполагаемое решение, проводится контроль погрешности моделирования.

7. Проверка адекватности реальному объекту.

Результаты, полученные по модели сопоставляются либо с имеющейся об объекте информацией или проводится эксперимент и его результаты сопоставляются с расчётными.

Процесс моделирования является итеративным. В случае неудовлетворительных результатов этапов 6. или 7. осуществляется возврат к одному из ранних этапов, который мог привести к разработке неудачной модели. Этот этап и все последующие уточняются и такое уточнение модели происходит до тех пор, пока не будут получены приемлемые ре-зультаты.

МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ – процесс построения и изучения математических моделей реальных процессов и явлений.

Математическая модель представляет собой совокупность соотношений (формул, уравнений, неравенств, логических условий), определяющих процесс изменения состояния системы в зависимости от ее параметров, входных сигналов, начальных условий и времени. Математические модели являются одним из основных инструментов познания человеком явлений окружающего мира. Под математическими моделями понимают основные закономерности и связи, присущие изучаемому явлению. Это могут быть формулы или уравнения, наборы правил или соглашений, выраженные в математиче-ской форме.

Особым классом математических моделей являются имитационные модели. Такие модели представляют собой компьютерную программу, которая шаг за шагом воспроизводит события, происходящие в реальной системе. Преимуществом имитационных моделей является возможность подмены процесса смены событий в исследуемой системе в реальном масштабе времени на ускоренный процесс смены событий в темпе работы программы. Результатом работы имитационной модели являются собранные в ходе наблюдения за протекающими событиями статистические данные о наиболее важных характеристиках сети: временах реакции, коэффициентах использования каналов и узлов, вероятности потерь пакетов и т.п.

В настоящее время широко применяется два вида математического моделирования: аналитическое и имитационное.

Аналитическое моделирование позволяет получать более точное решение, формируя математические законы, связывающие объекты системы, записанные в виде некото-рых функциональных соотношений. Задачей аналитического моделирования является решение уравнений для получения теоретических результатов и сопоставление этих результатов с практикой. К достоинствам аналитического моделирования можно отнести большую силу обобщения, многократность использования, но наиболее полное исследование процесса функционирования системы можно провести, если известны явные зависимости связывающие искомые характеристики с начальными условиями, параметрами и переменными системы. Однако такие зависимости удается получить для сравнительно простых систем. Чтобы использовать аналитический метод необходимо существенно упростить первоначальную модель, чтобы иметь возможность изучить общие свойства системы.

Более сложные задачи можно решать методом имитационного моделирования при условии, что не существует законченной математической постановки данной задачи, либо еще не разработаны аналитические методы решения сформулированной математической модели, либо если аналитические модели имеются, но процедуры столь сложны и трудоемки, что имитационное моделирование дает более простой способ решения задачи. Имитационные модели позволяют достаточно просто учитывать случайные воздействия и другие факторы, которые создают трудности при аналитическом исследовании. Данная модель позволяет про-водить эксперименты, меняя при этом условия протекания процесса, и в конечном счете определить такие условия, при которых результат удовлетворяет требованиям. Имитационное моделирование, как правило, осуществляется при помощи компьютеров и воспроизводит процесс функционирование системы во времени, имитируя явления, составляющие процесс с сохранением их логической структуры. Данные модели осуществляют прогон программы с заданными параметрами.

При формировании моделей систем должны учитываться следующие принципы системного подхода:

1. Принцип последовательного продвижения по этапу создания системы. Это значит, что система должна исследоваться как на макроуровне, т.е. во взаимоотношении с окружающей средой, так и внутри своей структуры.

2. Принцип согласования информационных, ресурсных и других характеристик проектируемых систем.

3. Принцип отсутствия конфликтов между целями отдельных подсистем и целями всей системы

Имитационное моделирование на сегодня становится все более зрелой технологией компьютерного моделирования, благодаря чему наблюдается устойчивый рост приложений этого метода в самых различных областях, связанных с управлением и принятием решений экономического, организационного, социального и технического характера.

При имитационном моделировании логическая структура моделируемой системы адекватно отображается в модели, а процессы ее функционирования и динамика взаимодействия ее элементов воспроизводятся (имитируют-ся) на модели. Поэтому построение имитационной модели включает в себя структурный анализ моделируемой системы и разработку функциональной модели, отражающей динамические портреты моделируемой системы.

Другой важной специфической особенностью имитационного моделирования, как вида моделирования, является то, что методом исследования компьютерной модели здесь является направленный вычислительный эксперимент, содержание которого определяется проведенными аналитическими исследованиями и соответствующими вычислительными процедурами, реализуемыми как на стадии стратегического планирования эксперимента, так и на стадии обработки и интерпретации его результатов.

Имитационные модели конкретных сложных живых систем, как правило, максимально учитывают имеющуюся информацию об объекте. Имитационные модели применяются для описания объектов различного уровня организации живой материи - от биомакромолекул до моделей биогеоценозов. В последнем случае модели должны включать блоки, описывающие как живые, так и 'косные' компоненты. Классическим примером имитационных моделей являются модели молекулярной динамики, в которых задаются координаты и импульсы всех атомов, составляющих биомакромолекулу и законы их взаимодействия. Вычис-ляемая на компьютере картина «жизни» системы позволяет проследить, как физические законы проявляются в функцио-нировании простейших биологических объектов - биомакромолекул и их окружения. Сходные модели, в которых элементами (кирпичиками) уже являются не атомы, а группы атомов, используются в современной технике компьютерного конструирования биотехнологических катализаторов и лекарственных препаратов, действующих на определенные активные группы мембран микроорганизмов, вирусов, или выполняющих другие направленные действия. Имитационные модели созданы для описания физиологических процессов. происходящих в жизненно важных органах: нервном волокне, сердце, мозге, желудочно-кишечном тракте, кровеносном русле. На них проигрываются «сценарии» процессов, протекающих в норме и при различных патологиях, исследуется влияние на процессы различных внешних воздействий, в том числе лекарственных препаратов. Имитационные модели широко используются для описания продукционного процесса растений и применяются для разработки оптимального ре-жима выращивания растений с целью получения максимального урожая, или получения наиболее равномерно распределенного во времени созревания плодов. Особенно важны такие разработки для дорогостоящего и энергоемкого тепличного хозяйства.

(По материалам http://www.allbest.ru/)

Общие принципы и задачи моделирования

В зависимости от цели моделирования, можно выделить два типа моделей: дескриптивные модели и модели поведения.

Дескриптивная модель позволяет получить информацию о взаимосвязях между наиболее важными переменными экосистемы. Реализуется такой тип модели методами стохастического моделирования, основанного на инструментах теории вероятностей и математической статистики. Разделяют статические методы, не учитывающие время в качестве переменной, и динамические методы, которые учитывают временную переменную. В отечественной литературе подобные модели получили название описательных.

Модели поведения описывают системы во время переходного периода от одного состояния к другому. Для осуществления этой категории моделей изучают:

1. структуру сигналов на входе и выходе системы

2. реакцию системы на особые проверочные сигналы

3. внутреннюю структуру системы.

Последний пункт реализуется аналитическим моделированием, в основе которого лежат дифференциальные уравнения, описывающие причинно-следственные связи в экосистеме. Первым этапом аналитического моделирования является формирование концепции модели и составление уравнений, описывающих поведение системы, при этом происходит упрощение реальности, которое, однако, не влияет на наиболее существенные свойства реальной системы. Затем идет определение количественных значений параметров. Осуществление этой задачи возможно тремя способами:

получением предварительных оценок значений параметров на основе наблюдений;

нахождением комбинаций параметров, отвечающих моделируемой ситуации, базирующимся на методах оптимизации параметров;

оценкой роли параметров модели с помощью анализа чувствительности, целью которого является определение того, как модель реагирует на изменение значений параметров и, как следствие, того, насколько правильно оценены параметры.

Следующий шаг аналитического моделирования - имитация, т.е. получение с помощью ЭВМ решения модельных уравнений при фиксированных значениях параметров и начальных условиях. И, наконец, испытание модели или, другими словами, сравнение ее выходных парамет-ров с выходными данными системы. Различают два способа испытания:

проверка (качественное или количественное сравнение данных, полученных в результате моделирования, с действительными значениями)

проверка значимости модели (проведение экспериментов для изучения поведения модели и системы с целью обнаружения их сходства, а также для сравнения тенденций поведения модели и системы).

Выделяется также адаптивное моделирование, при котором происходит автоматическая адаптация модели к системе с помощью ЭВМ.

Классификация математических моделей биологических продукционных процессов была предложена в книге Г.Ю. Ризниченко и А.Б. Рубина (1993). Различают три класса: 1) описательные модели; 2) качественные модели (выясняющие динамический механизм изучаемого процесса, способные воспроизвести наблюдаемые динамические эффекты в поведении системы); 3) имитационные модели конкретных сложных систем, учитывающие всю имеющуюся информацию об объекте (и позволяющие прогнозировать поведение систем или решать оптимизационные задачи их эксплуатации). Особое значение придается именно последнему классу моделей, поскольку он оказывается полезным для практических целей. Кратко можно выделить следующие основные этапы построения имитационной модели (Ризниченко, Рубин, 1993):

формулирование основных интересующих исследователя вопросов о поведении сложной системы, задание вектора состояния системы и системного времени;

декомпозиция системы на отдельные блоки, связанные, но относительно независимые; определение компонент вектора состояния каждого блока, которые должны преобразовываться в процессе функционирования;

формулирование законов и гипотез, определяющих поведение отдельных блоков и их взаимосвязь; разработка программ, соответствующих отдельным блокам;

верификация каждого блока при “замороженных” или линеаризованных информационных связях с другими блоками;

объединение разработанных блоков, при этом исследуются различные схемы их взаимодействия;

верификация имитационной модели в целом и проверка ее адекватности;

планирование и проведение экспериментов с моделью, статистическая обработка результатов и пополнение информационного фонда для дальнейшей работы с моделью.

Однако практика показала, что попытки детального описания многокомпонентных систем приводит к проблеме “прокля-тия размерности”, когда практически невозможно корректное построение и идентификация математической модели из-за использования чрезмерно большого количества неточно определенных параметров по сравнению с имеющейся экспериментальной информацией (Алексеев и др., 1992). В такой ситуации необходимо упрощение модели, например, за счет отбрасывания блоков или функциональных связей с второстепенным значением, выделения наиболее важных составляющих, определения быстрых и медленных переменных и замены части из них постоянными величинами или параметрическими зависимостями.

Две основные модели

В экологии существуют две классические модели, модель хищника и жертвы, и модель конкуренции двух видов.

а) Модель хищник-жертва.

Пусть N1=N1(t) - численность жертв, N2=N2(t) - численность хищников. Если бы хищников не было, то жертвы размножались бы экспоненциально быстро dN1/dt=k1N1. Но если имеется одновременно N1 жертв и N2 хищников, то вероятность встречи хищника и жертвы, скорее всего, пропрорциональна произведению N1N2, так что за время dt будет съедено б12N1N2 жертв. Отсюда получаем уравнение

dN1/dt=k1N1-б12N1N2. (1.1)

Далее, если бы жертв не было, то хищники гибли бы от голода, и притом, наверное, экспоненциально быстро: dN2/dt=-k2N2. Но если хищникам есть что покушать, то они размножаются со скоростью пропорциональной количеству съеденного. Получаем уравнение

dN2/dt=-k2N2+б21N1N2. (1.2)

Система уравнений 1.1 и 1.2 явно решается.

б) Модель конкуренции двух видов.

Считается, что имеется некоторая конкретная емкость среды К, равная максимально возможной численности данного ви-да в определенных условиях, получается следующее уравнение:

dN/dt=kN(1-N/K)=kN[(K-n)/K]. 1.3

Иными словами, вводится представление о том, что логарифмическая скорость роста N-1(dN/dt) Линейно снижается с возрастанием N. Уравнение 1.3 с начальным условием N (0) = n без труда решается явно. Качественная картина состоит в том, что небольшая в начале опыта численность вида монотонно возрастает по гладкой кривой. Это так называемый логистический рост. Логистическая кривая асимптотически приближается к максимально возможному значению К. Предположим, что имеются два вида, способные жить в какой-то определенной среде, причем каждый из них в отсутствии другого размножается по логистическому уравнению (1.3). Имеются, следовательно, два уравнения

dNi/dt=kiNi(1-Ni/Ki)= kiNi[(Ki-Ni)/Ki],i=1,2 (1.4)

Предположим, что при совместном выращивании двух видов в данной среде действие их друг на друга сводится к тому, что один вид потребляет часть ресурсов другого вида. Это означает, что в соответствующей модели следует вместо множителя 1-Ni/Ki, входящего в в уравнения в (1.4) в качестве фактора исчерпания ресурсов среды, подставить множитель 1-(Ni+бijNj)/Ki.

dN1/dt=k1N1(1- (N1+б12N2)/K1),

dN2/dt=k2N2(1- (N2+б21N1)/K2). (1.5)

Система (1.5) мыслится как общее описание взаимодействия двух видов, живущих в одной среде обитания. Остается вопрос, действует ли в каких-то конкретных условиях система (1.5) с какими-нибудь значениями коэффициентов.

Модели лесных экосистем

По сравнению с агрокультурой, лесное сообщество представляет собой гораздо более сложную экосистему. Если посевы сельскохозяйственных культур можно рассматривать как пространственно однородные сообщества, то для леса такой подход очевидно не применим.

Наиболее широко принятой в современной в экологии лесных сообществ является ярусно-мозаичная концепция леса как сложной системы. "Элементом" здесь является не отдельное дерево, а ассоциация деревьев. Лесной ценоз представляет собой пространственную мозаику, состоящую из элементов , которые развиваются относительно независимо, проходя определенные фазы развития. В цикле возобновления леса можно выделить следующие основные стадии:

стадия прогалины (окна), образующегося в результате гибели дерева или группы деревьев. Для этой стадии в литературе утвердился английский термин "gap";

стадия прироста, на которой доминирует молодое поколение;

стадия зрелости, образованная взрослыми деревьями.

Устойчивое существование лесного, биогеоценоза обеспечивается оптимальной ярусно-мозаичной структурой леса, представленного всеми тремя стадиями. Древесная ассоциация - локус, характеризуется видовым составом, густотой, пространственными размерами, которые определяют особенности развития и процессы формирования локусов как ячеек леса в пространстве. (Подробный анализ этих понятий см.: Попадюк Р.В., Чистякова А.А. и др. "Восточноевропейские широколиственные леса").

Наибольшее распространение для кратко- и среднесрочного прогнозирования динамики конкретных экосистем на небольших территориях (1-1000 га) получили гэп-модели, основой которых является модель отдельного гэпа, описывающая динамику деревьев на участке фиксированной площади, обычно 10х10 м. В каждый момент времени каждое дерево заданной породы характеризуется определенным набором переменных. Уравнение роста зависит от светового режима, температуры и других параметров среды, также учитывается конкуренция растений за ресурсы. Возобновление и гибель деревьев на участке задают обычно каким-либо случайным процессом. Влияние соседних гэпов как правило не учитывают. Первая модель такого типа (JABOVA) (Botkin et al. 1972) строилась как большая имитационная модель. Начиная с роста отдельного дерева в оптимальных условиях с последующим учетом влияния на рост и численность деревьев уменьшения количества света и питательных веществ вследствие конкуренции. По этой методике были созданы десятки моделей для разного типа лесных сообществ.

Гэп-моделирование оказало существенное влияние на формирование ярусно-мозаичной концепции леса, может рассматриваться как широкомасштабный компьютерный эксперимент по проверке основных положений и следствий этой концепции и является примером прямого воздействия математических методов на формирование естественно-научных представлений в области экологии.

Для описания лесных массивов на больших пространственных и временных масштабах используются структурные модели метапопуляций т.е. модели, в которых элемент (индивидуум) является субпо-пуляцией, состоящей из более простых объектов.

Структурные модели популяции деревьев, в которых индивидуальным объектом является отдельное дерево, неоднократно предлагались. Наиболее сложной частью этих моделей является описание взаимодействия между деревьями, которое может носить сложный нелинейный характер. При переходе к ярусно-мозаичной концепции, взаимодействие между деревьями оказывается "внутри" субпопуляции, модель которой при относительной независимости субпопуляций (локусов, гэпов) может рассматриваться автономно. Следующий этап моделирования связан с рассмотрением лесной экосистемы как метапопуляции, состоящей из большого числа гэпов. Для этого необходимо описать интенсивность гибели гэпов, как целостных образований. Такие фундаментальные характеристики, как вероятность гибели и продолжительность жизни гэпа и метапопуляции в целом, зависят от начальной численности и других характеристик начального распределения деревьев внутри гэпа. В результате моделирования получается единственное устойчивое состояние "динамического равновесия", представляющего собой мозаику находящихся в различных состояниях и возрастах гэпов, каждый из которых возникает, развивается и гибнет по внутренним законам, однако распределение всей совокупности гэпов является стационарным.

Если исходное состояние растительности было относительно однородным, (например, после быстрого заселения территории, освободившейся в результате катастрофического внешнего воздействия - пожаров, нападения насекомых, рубок и др.), то образование мелкоячеистой мозаичной структуры возможно лишь в процессе смены нескольких поколений. Поэтому на территориях, подверженных сильным внешним воздействиям на временах порядка жизни одного поколения, динамику лесной растительности моделируют в более крупных пространственных масштабах. (Карев Г.П., 1994). При этом получают оценки времени и видовые характеристики сукцессионного ряда (процесса смены видов после начала заселения территории) и пространственно-временную структуру климаксного (стационарного) сообщества.

В качестве примера приведу математическую модель экосистемы бореальных лесов Восточной Сибири.

Природные экосистемы Сибири играют существенную роль в стабилизации атмосферы и гидросферы в условиях современного климата, особенно в связи с аккумулированием тепличных газов из атмосферы. В настоящее время неизвестно, как будут функционировать и изменяться существующие природные экосистемы на территории Сибири в условиях меняющегося глобального и особенно регионального климата.

Разработан метод основанный на разделении рассматриваемого региона на компартменты, однородные по своим структурно-

функциональным характеристикам (биоценозы). Каждый из этих компартментов моделируется как целое в его условном центре, однако задается и градиент изменения параметров от центра к границам компартмента. Моделирование компартмента-биоценоза происходит при помощи обыкновенных дифференциальных уравнений. Число компартментов и границы между ними определяются путем анализа баз данных по исследуемому региону. Данный метод предпочтительнее еще и потому, что имеет дело с реальным биологическим объектом - биоценозом, тогда как традиционные методы создают искусственную градацию.

Схема компартментов включает границы биоценозов, а также их условные центры. Модельный центр не обязательно физический центр компартмента-биоценоза, это точка, в которой значения определяющего компонента биоценоза равно среднему по всему биоценозу. Эта точка считается центром координат при определении координат всех других точек биоценоза. Параметры, влияющие на динамику биомассы определяющего компонента биоценоза, изменяются по отношению к центральной точке, т.е. имеется их градиент. Таким образом, можно рассчитать динамику любого компонента системы в любой интересующей нас точке.

Построена точечная математическая модель экосистемы бореальных лесов Восточной Сибири, для описания основных процессов в цикле углерода, способная к пространственным расчетам на основе предложенного выше метода.

В модели потоков вещества в бореальном лесу описаны следующие основные процессы, позволяющие исследовать поведение системы, не превращая в то же время ее в сложную для анализа имитационную модель - фотосинтез, дыхание, сезонные изменения активной фитомассы, водный баланс дерева, влияние на фотосинтез освещенности, концентрации углекислого газа, воды. Также в модель включено описание влияния

гетеротрофов на изменение фитомассы, водного баланса почвы, баланса минеральных элементов. Такие факторы как солнечная радиация, динамика осадков и температуры, вертикальный и горизонтальный перенос атмосферных газов являются входными параметрами модели. Модель может быть расширена на другие экосистемы соответствующей группы.

Также моделью рассчитываются скорости потоков углерода из атмосферы в бореальный лес и обратно, что позволяет использовать эти данные непосредственно в качестве входных параметров в моделях атмосферы. В модели учтен такой важный фактор, влияющий на накопление углерода в лесных системах, как лесные пожары. Частота и интенсивность их задаются рендомизационной функцией.

Общий численный прогноз развития ценоза бореальных лесов в условиях глобального изменения климата для различных сценариев, в частности его реакции на изменение среднегодовой температуры, влажности, освещенности, фоновых концентраций кислорода и углекислого газа, показал следующее. При увеличении температуры и влажности в пределах оценок сценариев «глобального изменения» интенсивность круговорота в экосистеме возрастает на 10-15%. Учет снижения освещенности, напрямую связанную с увеличением влажности, несколько снижает эффект. Так же и постоянное увеличение температуры ведет в конечном итоге к подавлению системы. Увеличение же только концентрации углекислого газа без учета других факторов не приводит к заметному изменению.

Модельный расчет показал, что в результате возрастания температуры и влажности происходит накопление углерода бореальными лесами, причем в основном в биомассе дерева. Скорость аккумуляции углерода может достигать значений 0.8-1.0 тонн углерода на гектар в год. Однако при учете фактора лесных пожаров модельный прогноз неоднозначен, возможно, из-за недостаточно строгого модельного описания этого существенного процесса.

Глобальные модели

Особый статус имеют математические модели, в которых рассматриваются глобальные изменения биоты в результате тех или иных антропогенных воздействий, или изменений климата в результате космических или геофизических причин. Классической является модель ядерной зимы, предсказавшая глобальное изменение климата на срок в несколько десятилетий в сторону понижения температур ниже нуля по Цельсию и гибель биосферы в случае широкомасштабной ядерной войны. Эта модель и ее последующее обсуждение имели несомненное политическое значение и в большой мере послужили причиной приостанови гонки ядерных вооружений.

При моделировании глобальных экологических процессов необходимо учитывать огромное число факторов, пространственную неоднородность Земли, физические и химические процессы, антропогенные воздействия, связанные с развитием промышленности и ростом народонаселения. Сложность задачи требует применения системного подхода, впервые введенного в практику математического моделирования Дж. Форрестером (Principles of systems. 1968, World Dynamics, 1971). Результатом работ, выполненных по заказу Римского клуба - международной группы выдающихся бизнесменов, государственных деятелей и учены стала построенная на основе идей Дж. Форрестера компьютерная модель "World 3". В 1972 г. результаты этой работы были суммированы в книге D.Meadows et al. "The limits to Growth", которая вызвала сенсацию. В модели Земля была рассмотрена как единая система, в которой происходят процессы, связанные с ростом населения, промышленного капитала, производства продуктов питания, потребления ресурсов и загрязнения окружающей среды. Результаты моделирования взаимодействия этих процессов привели к неутешительному выводу о том, что если существующие тенденции роста численности населения мира, индустриализации, загрязнения окружающей среды, производства продуктов питания и истощения ресурсов останутся неизменным, пределы роста на нашей планете будут достигнуты в течение ближайших десятилетий.

В последующие годы работа над моделью была продолжена. Блоки, характеризующие каждый из процессов, были разработаны гораздо более подробно, в модель включены данные, полученные за прошедшие годы специалистами разных областей. Результаты достаточно популярно изложены в книгe Donella Meadows,, Dennis Meadows, Jorgen Randers "Beyond the Limits". Возможные пути достижения предельно допустимого уровня численности человечества.

Прогноз развития системы в случае сохранения существующих в настоящее время тенденций. Для того, чтобы осуществился сценарий монотонного приближения к устойчивому равновесию необходимо принятие программ стабилизации численности населения и объема промышленного производства, внедрения технологий, уменьшающих выбросы загрязняющих веществ, эрозию почв и повышающих эффективность использования природных ресурсов.

Существует точка зрения, что стабилизация численности населения произойдет в силу системного развития человечества в процессе так называемого демографического перехода. Прогнозы такого типа моделей дают также критическую дату падения скорости роста человечества около 2030. В этом случае численность будет еще продолжать расти примерно до конца следующего века и остановится на цифре 12-14 млрд. человек. Так или иначе, работа над внедрением энергосберегающих технологий, борьба против хищнического расходования природных ресурсов и за охрану окружающей среды остается необходимым условием выживания человечества.

В настоящее время интенсивно разрабатываются глобальные модели для прогнозирования климатических изменений, связанных с парниковым эффектом. (Edmonds J, Reilly j. 1985; "Global Energy: Assessing the Future"),, (Alkamo J.(ed), 1994: "IMAGE 2.0: Integrating Mod-eling of Global Climate Change").

Такого типа интегральные модели включают в себя огромные массивы сведений о включенных в них подсистемах. Например, разработанная в рамках международной программы "Climate Change 1995. Impacts, adaptations and mitigation of Climate Change; Scientific-Technical Analysis" модель IMAGE (Integrated Model to Assess the Greenhouse Effect) включает в себя несколько взаимосвязанных блоков c разной степенью пространственной детализации. Субмодель "Промышленная энергетическая система" рассматривает 13 промышленных регионов, в каждом из них подсчитывается расходование энергии и промышленная продукция. Субмодель" "Экосистема суши" в этой модели разработана наиболее детально: изменения моделируются на сетке со стороной ячейки в 0,5 градуса. Каждая ячейка характеризуется своим климатом, топографией, почвой и растительным покровом с учетом взаимодействий растительность - климат - почва и изменений, которые вносятся в эту систему при эксплуатации человеком земель для сельскохозяйственных и промышленных нужд. Изменения растительного покрова рассчитываются в специальной подмодели "BIOME" (Prentice, 1992). Рассчитывают потенциальную продуктивность агрокультур и естественного растительного покрова, а также потребности населения данной территории в пище, корме для животных, древесине, топливе с учетом предпочтений населением того или иного вида пищи, и социоэкономических факторов. Учитываются также потоки продовольственных и промышленных товаров из одних районов Земли в другие, интенсивность автотранспорта в данной местности, инфраструктура, численность населения. Таким образом устанавливаются локальные модели углеродного обмена для каждой местности и баланс газов, определяющих парниковый эффект, содержание которых в атмосфере включается в подмодель "Система атмосферы и океанов".. Модель дает прогноз таяния полярных людов, поднятия уровня мирового океана, значительного потепления климата в северном полушарии, в том числе на территории России, и связанного с этим смещения границ растительности, в том числе широколиственных и хвойных лесов к северу в область тундры.

Смысл таких глобальных моделей заключается в том, что они позволяют оценить вклад отдельных процессов и регионов в общий баланс вещества и энергии на Земле, и решать обратную задачу о влиянии на локальные процессы этих глобальных показателей. Такой всесторонний учет множества факторов и связей возможет только в рамках моделей, интегрирующих знания о тысячах взаимосвязей и десятках и сотнях тысяч параметров пространственно неоднородной системы и возможен только с использованием современной вычислительной техники и геоинформационных технологий.

Основы статистики

План.

Основы статистики
Статистические характеристики количественной изменчивости
Статистические характеристики качественной изменчивости
Типы статистического распределения
Методы проверки статистических гипотез

Окружающий нас мир насыщен информацией - разнообразные потоки данных окружают нас, захватывая в поле своего действия, лишая правильного восприятия действительности. Не будет преувеличением сказать, что информация становится частью действительности и нашего сознания.

Без адекватных технологий анализа данных человек оказывается беспомощным в жестокой информационной среде и скорее напоминает броуновскую частицу, испытывающую жесткие удары со стороны и не имеющую возможности рационально принять решение.

Статистика позволяет компактно описать данные, понять их структуру, провести классификацию, увидеть закономерности в хаосе случайных явлений. Даже простейшие методы визуального и разведочного анализа данных позволяют существенно прояснить сложную ситуацию, первоначально поражающую нагромождением цифр.

Статистическое описание совокупности объектов занимает промежуточное положение между индивидуальным описанием каждого из объектов совокупности, с одной стороны, и описанием совокупности по её общим свойствам, совсем не требующим её расчленения на отдельные объекты, - с другой. По сравнению с первым способом статистические данные всегда в большей или меньшей степени обезличены и имеют лишь ограниченную ценность в случаях, когда существенны именно индивидуальные данные (например, учитель, знакомясь с классом, получит лишь весьма предварительную ориентировку о положении дела из одной статистики числа выставленных его предшественником отличных, хороших, удовлетворительных и неудовлетворительных оценок). С другой стороны, по сравнению с данными о наблюдаемых извне суммарных свойствах совокупности статистические данные позволяют глубже проникнуть в существо дела. Например, данные гранулометрического анализа породы (то есть данные о распределении образующих породу частиц по размерам) дают ценную дополнительную информацию по сравнению с испытанием нерасчленённых образцов породы, позволяя в некоторой мере объяснить свойства породы, условия её образования и прочее.

Метод исследования, опирающийся на рассмотрение статистических данных о тех или иных совокупностях объектов, называется статистическим. Статистический метод применяется в самых различных областях знания. Однако черты статистического метода в применении к объектам различной природы столь своеобразны, что было бы бессмысленно объединять, например, социально-экономическую статистику, физическую статистику.

Общие черты статистического метода в различных областях знания сводятся к подсчёту числа объектов, входящих в те или иные группы, рассмотрению распределения количеств, признаков, применению выборочного метода (в случаях, когда детальное исследование всех объектов обширной совокупности затруднительно), использованию теории вероятностей при оценке достаточности числа наблюдений для тех или иных выводов и т. п. Эта формальная математическая сторона статистических методов исследования, безразличная к специфической природе изучаемых объектов, и составляет предмет математическая статистика

Связь математической статистики с теорией вероятностей имеет в разных случаях различный характер. Теория вероятностей изучает не любые явления, а явления случайные и именно «вероятностно случайные», то есть такие, для которых имеет смысл говорить о соответствующих им распределениях вероятностей. Тем не менее, теория вероятностей играет определённую роль и при статистическом изучении массовых явлений любой природы, которые могут не относиться к категории вероятностно случайных. Это осуществляется через основанные на теории вероятностей теорию выборочного метода и теорию ошибок измерений. В этих случаях вероятностным закономерностям подчинены не сами изучаемые явления, а приёмы их исследования.

Более важную роль играет теория вероятностей при статистическом исследовании вероятностных явлений. Здесь в полной мере находят применение такие основанные на теории вероятностей разделы математической статистики, как теория статистической проверки вероятностных гипотез, теория статистической оценки распределений вероятностей и входящих в них параметров и так далее. Область же применения этих более глубоких статистических методов значительно уже, так как здесь требуется, чтобы сами изучаемые явления были подчинены достаточно определённым вероятностным закономерностям.

Вероятностные закономерности получают статистическое выражение (вероятности осуществляются приближённо в виде частот, а математические ожидания - в виде средних) в силу больших чисел закона.

Чтобы выявить и оценить лучшие агротехнические приемы и сорта, изучаемые в полевом опыте, применяют статистическую обработку данных опыта, представленных в виде поделяночных числовых показателей урожайности и других свойств и качеств подопытных растений. Эти показатели характеризуют изучаемое явление и отражают результат действия исследуемых факторов, проявившихся в конкретном месте за определенный период времени, со всеми искажениями, отступлениями от истинных данных вследствие различных причин, наблюдавшихся во время проведения опыта.

Статистика в широком понимании может быть определена как наука о количественном анализе массовых явлений природы и общества, служащем для выявления их качественных своеобразий.

Статистикой называется отрасль знаний, объединяющая принципы и методы с числовыми данными, характеризующими массовые явления. В этом смысле статистика включает в себя нескольких самостоятельных дисциплин: общую теорию статистики как вводный курс, теорию вероятностей и математическую статистику как науки об основных категориях и математических свойствах генеральной совокупности и их выборочных оценках.

Слово «статистика» происходит от латинского слова status - состояние, положение вещей. Первоначально оно употребляется в значении «политическое состояние». Отсюда итальянское слово stato – государство и statista – знаток государства. В научный обиход слово «статистика» вошло в 18 веке и первоначально употреблялось как «государствоведение».

В настоящее время статистика может быть определена как собирание массовых данных, их обобщение, представление, анализ и интерпретация. Это особый метод, который используется в различных сферах деятельности, в решении разнообразных задач.

Статистика позволяет выявить и измерить закономерности развития социально-экономических явлений и процессов, взаимосвязи между ними. Познание закономерностей возможно только в том случае, если изучаются не отдельные явления, а совокупности явлений, поскольку закономерности проявляются в полной мере, лишь в массе явлений. В каждом отдельном явлении необходимое – то, что присуще всем явлениям данного вида, проявляется в единстве со случайным, индивидуальным, присущим лишь этому конкретному явлению.

Закономерности, в которых необходимость неразрывно связана в каждом отдельном явлении со случайностью и лишь во множестве явлений проявляет себя закон, называются статистическими.

Соответственно предметом статистического изучения всегда выступают совокупности тех или иных явлений, включающие все множество проявлений исследуемой закономерности. В большой совокупности индивидуальные разнообразия взаимнопогашаются, и на первый план выходят закономерные свойства. Поскольку статистика призвана выявлять закономерное, она, опираясь на данные о каждом отдельном проявлении изучаемой закономерности, обобщает их и таким образом получает количественное выражение этой закономерности.

Каждый шаг исследования завершается интерпретацией полученных результатов: какое заключение можно сделать исходя из проведенного анализа, что говорят цифры – подтверждают ли они исходные предположения или открывают что-то новое? Интерпретация данных ограничена исходным материалом. Если заключения основаны на данных выборки, то она должна быть репрезентативной, чтобы выводы были отнесены к совокупности в целом. Статистика позволяет выяснить все то полезное, что содержится в исходных данных и определить, что и как можно использовать в принятии решений.

Термин вариационная статистика был введен в 1899году Дункером для обозначения методов математической статистики, применяемых при изучении некоторых биологических явлений. Несколько ранее, в 1889 году, Ф. Гальтоном был введен другой термин – биометрия (от греческих слов «биос» - жизнь и «метрейн» - измерять), обозначавший применение некоторых методов математической статистики при изучении наследственности, изменчивости и других биологических явлений. Основываясь на теории вероятностей, вариационная статистика позволяет правильно подойти к анализу количественного выражения изучаемых явлений, дать критическую оценку достоверности полученных количественных показателей, установить характер связи между изучаемыми явлениями, а, следовательно, понять их качественное своеобразие.

Важно помнить, что всякий биологический объект обладает изменчивостью. Т.е. каждый из признаков (высота растений, число зерен в колосе, содержание элементов питания) у различных особей может иметь различную степень выраженности, что свидетельствует о колеблемости или варьировании признака.

При статистическом методе исследования внимание сосредоточено не на отдельном объекте, а на группе однородных объектов, т.е. на некоторой их совокупности, объединенных для совместного изучения. Некоторое количество однородных единиц, расположенных по какому-либо одному или нескольким изменяющимся признакам, называется статистической совокупностью.

Статистические совокупности делятся на:

генеральные
выборочные

Генеральная совокупность объединяет все возможные изучаемые однородные единицы, например, растения на поле, популяции вредителей на поле, возбудители болезней растений. Выборочная совокупность представляет собой некоторую часть единиц, взятых из общей совокупности и попавших на проверку. При изучении, например, урожайности яблонь определенного сорта генеральную совокупность представляют все деревья данного сорта, возраста, произрастающие в определенных однородных условиях. Выборочная совокупность состоит из некоторого количества деревьев яблони, взятых на пробных площадках в изучаемых насаждениях.

Совершенно очевидно, что при статистических исследованиях приходится иметь дело исключительно с выборочными совокупностями. Правильность суждений о свойствах генеральной совокупности на основании анализа выборочной совокупности, прежде всего, зависит от ее типичности. Таким образом, чтобы выборка действительно отражала характерные свойства генеральной совокупности, выборочная совокупность должна объединять достаточное количество однородных единиц, обладающих свойством репрезентативности. Репрезентативность достигается случайным отбором вариант из генеральной совокупности, что обеспечивает равную возможность для всех членов генеральной совокупности попасть в состав выборки.

Статистическое изучение тех или иных явлений в своей основе имеет анализ изменчивости показателей или величин, входящих в состав статистических совокупностей. Статистические величины могут принимать разные значения, обнаруживая при этом в своей изменчивости некоторую закономерность. В связи с этим статистические величины можно определить как величины, принимающие различные значения с определенными вероятностями.

В процессе наблюдений или проведения опытов мы сталкиваемся с различными по своему роду изменчивыми показателями. Одни из них носят ярко выраженный количественный характер и легко поддаются измерениям, другие же не могут быть выражены обычным количественным путем и носят типичный качественный характер.

В связи с этим различают два типа изменчивости или варьирования:

количественная
качественная

Статистические характеристики количественной изменчивости

В качестве примера количественной изменчивости следует отнести: изменчивость количества колосков в колосе пшеницы, изменчивость размеров и веса семян, содержания в них жиров, белков и т.д. Примером качественного варьирования служат: изменение окраски или опушенности различных органов растения, гладкий и морщинистый горох, обладающий зеленой или желтой окраской, различная степень пораженности растений болезнями и вредителями.

Количественное варьирование в свою очередь может быть разделено на два рода: варьирование непрерывное и прерывистое.

Непрерывное варьирование объединяет случаи, когда изучаемые совокупности состоят из статистических единиц, определяемых измерениями или вычислением на основе этих измерений. Примером непрерывного варьирования можно выразить: вес и размеры семян, длина междоузлий, урожайность сельскохозяйственных культур. Во всех этих случаях изучаемые количественные показатели теоретически могут принимать все возможные значения, как целые, так и дробные между крайними своими пределами. Переход от крайнего минимального значения к максимальному теоретически является постепенным и может быть представлен сплошной линией.

При прерывистом варьировании отдельные статистические величины представляют собой совокупность отдельных элементов, выражаемую уже не измерением и не вычислением, а счетом. Примером такого варьирования могут служить изменение числа семян в плодах, числа лепестков в цветке, числа деревьев на единице площади, числа початков кукурузы на одном растении. Такого типа прерывистые варьирования называются также иногда целыми, потому, что отдельные статистические величины приобретают вполне определенные целые значения, в то время как при непрерывном варьировании эти величины могут выражаться и целыми, и дробными значениями.

Основными статистическими характеристиками количественной изменчивости являются следующие:

1.Средняя арифметическая;

Показатели изменчивости признака:

2. дисперсия;

3. стандартное отклонение;

4. коэффициент вариации;

5. Стандартная ошибка средней арифметической;

6. Относительная ошибка.

Cреднее арифметическое. При изучении варьирущих количественных показателей основной сводной величиной является их среднее арифметическое значение. Среднее арифметическое служит как для суждения об отдельных изучаемых совокупностях, так и для сравнения соответствующих совокупностей друг с другом. Полученные средние значения являются основой для построения выводов и для разрешения тех или иных практических вопросов.

Для вычисления среднего арифметического используют следующую формулу: если сумму всех вариант (x₁ + x₂ + … + x_n) обозначить через Σ x_i , число вариантов - через n, то средняя арифметическая определяется:

x_ср.=Σ x_i/ n)

Среднее арифметическое дает первую общую количественную характеристику изучаемой статистической совокупности. При разрешении ряда теоретических и практических вопросов, наряду со знанием среднего значения анализируемого показателя, возникает необходимость в дополнительном установлении характера распределения вариант около этого среднего.

Объктам сельскохозяйственных и биологических исследований свойственна изменчивость признаков и свойств во времени и в пространстве. Причинами ее являются как внутренние, наследственные особенности организмов, так и различная норма их реакции на условия внешней среды.

Выявление характера рассеяния – одна из основных задач статистического анализа опытных данных, который позволяет не только оценить степень разброса наблюдений, но и использовать эту оценку для анализа и интерпретации результатов исследования.

Характер группировки вариант около их среднего значения, называемый также рассеянием, может служить показателем степени изменчивости изучаемого материала. Показатели изменчивости. Лимиты (размах варьирования) – это минимальное и максимальное значения признака в совокупности. Чем больше разность между ними, тем изменчивее признак.

Дисперсия S² и стандартное отклонение S. Эти статистические характеристики являются основными мерами вариации (рассеяния) изучаемого признака. Дисперсия (средний квадрат) – это частное от деления суммы квадратов отклонений Σ (x –x) ² на число всех измерений без единицы:

Σ (x – x) ² / n -1

Стандартное, или среднее квадратическое, отклонение получают путем извлечения квадратного корня из дисперсии:

S = √ S²

Стандартное отклонение характеризует собой степень изменчивости изучаемого материала, меру степени влияния на признак различных второстепенных причин его варьирования, выраженных в абсолютных мерах, т.е. в тех же единицах измерения, что и отдельные значения вариант. В связи с этим стандартное отклонение может быть использовано только при сравнении изменчивости статистических совокупностей, варианты которых выражены в одинаковых единицах измерения.

В статистике принято считать, что диапазон изменчивости в совокупностях достаточно большого объема, которые находятся под постоянным влиянием множества разнообразных и разнонаправленных факторов (биологические явления), не выходят за пределы 3S от среднего арифметического значения. О таких совокупностях говорят, что они подчиняются нормальному распределению вариант.

Ввиду того, что диапазон изменчивости для каждой исследуемой биологической совокупности находится в пределах 3S от среднего арифметического, то чем больше величина стандартного отклонения, тем больше изменчивость признака в исследуемых совокупностях. Стандартное отклонение используется как самостоятельный показатель, так и в качестве основы для вычисления других показателей.

При сравнении изменчивости разнородных совокупностей необходимо пользоваться мерой варьирования, представляющей собой отвлеченное число. Для этой цели в статистике введен коэффициент вариации, под которым понимают стандартное отклонение, выраженное в процентах к средней арифметической данной совокупности:

**V = S / x * 100%.**

Коэффициент вариации позволяет дать объективную оценку степени варьирования при сравнении любых совокупностей. При изучении количественных признаков он позволяет выделить из них наиболее устойчивые. Изменчивость считают незначительной, если коэффициент вариации не превышает 10%, средней – если он от 10% до 20%, и значительной – если он более 20%.

На основании рассмотренных показателей приходим к суждению о качественном своеобразии всей генеральной совокупности. Очевидно, что степень надежности наших суждений о генеральной совокупности будет зависеть, прежде всего, от того, насколько в той или иной части выборочной совокупности ее индивидуальные, а также случайные особенности не мешают проявлению общих закономерностей и свойств изучаемого явления.

В связи с тем, что при проведении опытных работ и научных исследований в большинстве случаев мы не можем оперировать с очень большими по численному составу выборками, то возникает необходимость определения возможных ошибок в наших характеристиках изучаемого материала на основе этих выборок. Необходимо отметить, что под ошибками в данном случае следует понимать не погрешности в вычислениях тех или иных статистических показателей, а пределы возможных колебаний их значений по отношению ко всей совокупности.

Сопоставление отдельных найденных значений статистических показателей с возможными пределами их отклонений и служит, в конечном счете, критерием оценки надежности для полученных выборочных характеристик. Разрешение этого важного как в теоретическом, так и в практическом отношениях вопроса дает теория статистических ошибок.

Подобно тому, как распределяются варианты вариационного ряда около своего среднего, так же будут распределяться и частные значения средних, полученных из отдельных выборок. Т. е., чем сильнее будут варьировать изучаемые объекты, тем сильнее будут варьировать и частные значения. Вместе с тем, чем на большем числе вариант будут получены частные значения средних, тем ближе они будут к истинному значению среднего арифметического всей статистической совокупности. На основании выше изложенного ошибка выборочной средней (стандартная ошибка) является мерой отклонения выборочной средней от средней генеральной совокупности. Ошибки выборки возникают в результате неполной репрезентативности выборочной совокупности, а также при перенесении данных, полученных при изучении выборки, на всю генеральную совокупность. Величина ошибки зависит от степени изменчивости изучаемого признака и объема выборки.

Стандартная ошибка прямо пропорциональна выборочному стандартному отклонению и обратно пропорциональна корню квадратному из числа измерений:

S_X = S / "√ n

Ошибки выборки выражают в тех же единицах измерения, что и варьирующий признак и показывает те пределы, в которых может заключаться истинное значение среднего арифметического изучаемой генеральной совокупности. Абсолютная ошибка выборочной средней используется для установления доверительных границ в генеральной совокупности, достоверности выборочных показателей и разности, а также для установления объема выборки в научно-исследовательской работе.

Ошибка среднего может быть использована для получения показателя точности исследования - относительной ошибки выборочной средней. Это ошибка выборки, выраженная в процентах от соответствующей средней:

**S_X, % = S_x / x_ср *100**

Результаты считаются вполне удовлетворительными, если величина относительной ошибки не превышает 3-5% и соответствует удовлетворительному уровню, при 1-2% - очень высокая точность, 2-3% - высокая точность.

Статистические характеристики качественной изменчивости

Наряду с широко распространенным типом количественной изменчивости имеется немало случаев, когда различия между вариантами изучаемой статистической совокупности характеризуются качественными характеристиками.

Во всех случаях качественного варьирования распределение вариант по тому или иному признаку сводится, в конечном счете, к двум группам: окраска цветков у гибридных растений может быть выражена белая и розовая; красная и не красная; женские и мужские растения; здоровые и больные растения.

Поэтому такое качественное варьирование называется еще альтернативным (от французского – чередование, выбор, одно из двух), т.е. когда реализация одной из возможных альтернатив исключает тем самым возможность реализации другой.

Статистическая обработка полученных данных при альтернативной качественной изменчивости сводится к изучению количественного соотношения между обеими группами и установления процента наличия p и процента отсутствия q исследуемого явления.

Основные статистические показатели качественной изменчивости:

доля признака – p и q,
показатель изменчивости – S,
коэффициент вариации –V,
ошибка выборочной доли – S_p

Доля признака (относительная численность) отдельной варианты в данной совокупности и обозначается через p₁, p₂, p₃…. P_n. Выражается доля признака в частях единицы или в %. В первом случае сумма всех долей в пределах совокупности составляет 1, а во втором случае – 100%.

Доля признака – это отношение численности каждого из членов ряда n₁, n₂, n₃, ….n_n к численности N. Иными словами, доля признака – это вероятность появления данного признака в изучаемой совокупности:

p₁ = n₁ / N; p₂ = n₂ / N; и т.д.

Поскольку при альтернативной изменчивости доля одного признака равна - p, второго - q, вероятность двух противоположных явлений может быть выражена равенством p + q = 1 (100), а доля второго признака на основании равенства будет q = 1 – p.

Показатель изменчивости качественного признака (S), характеризующий варьирование величин ряда относительно друг друга, служит мерой степени варьирования и определяется по формуле:

S = √ pq

Так как сумма процентных выражений частот обеих альтернатив всегда равна 100%, то значение среднего квадратического отклонения, выраженное в процентах, изменяется в пределах от 0-50%. В зависимости от соотношения p и q значение S изменяется от 0-0,5. Если количество градаций признака больше двух (К ? 2), то S определяется по формуле:

**S =^k√ p₁ * p₂ * p₃ …* p_k**

Коэффициент вариации качественных признаков VP – это показатель изменчивости, выраженный в % к максимальной изменчивости:

**V_P = S / S_max *100**

Коэффициент вариации характеризует относительную степень изменчивости исследуемых признаков и используется для сравнительной оценки выравненности различных совокупностей.

Ошибка выборочной доли (S_P) - это мера отклонения доли признака выборочной совокупности от доли его во всей генеральной совокупности вследствие неполной представительности выборки. Вычисляется по формуле:

S_P = S / √ N, где

S – показатель изменчивости качественного признака;

N – объем выборки.

Типы статистического распределения

Частота проявления определенных значений признака в совокупности называется распределением. Различают эмпирические и теоретические распределения частот совокупности результатов наблюдений. Эмпирическое распределение – это распределение результатов измерений, полученных при изучении выборки. Теоретическое распределение предполагает распределение измерений на основании теории вероятностей. К их числу относятся: нормальное (Гауссово) распределение, распределение Стьюдента (t – распределение), F – распределение, распределение Пуассона, биноминальное.

Наибольшее значение в биологических исследованиях имеет нормальное или Гауссово распределение – это совокупность измерений, в котором варианты группируются вокруг центра распределения и их частоты равномерно убывают вправо и влево от центра распределения (x). Отдельные варианты отклоняются от средней арифметической симметрично, и размах вариации в обе стороны не превышает 3 σ . Нормальное распределение характерно для совокупностей, на членов которых суммарно влияет бесконечно большое количество разнообразных и разнонаправленных факторов. Каждый фактор вносит определенную часть в общую изменчивость признака. Бесконечные колебания факторов обусловливают изменчивость отдельных членов совокупностей.

Графическое выражение этого распределения называется Гауссовой кривой, или кривой нормального распределения. Опытным путем установлено, что такая кривая часто повторяет форму гистограмм, получающихся при большом числе наблюдений.

Форма кривой нормального распределения и ее положение определяются двумя величинами: генеральной средней и стандартным отклонением.

В практических исследованиях непосредственно формулой не пользуются, а прибегают к помощи таблиц.

Максимум, или центр, нормального распределения лежит в точке x = μ точка перегиба кривой находится при x1= μ - σ и x2= μ + σ , при n = ± ∞ кривая достигает нулевого значения. Размах колебаний от μ вправо и влево зависит от величины σ и укладывается в пределах трех стандартных отклонений:

1. В области пределов μ + σ находится 68,26% всех наблюдений;

2. Внутри пределов μ + 2 σ находится 95,46% всех значений случайной величины;

3. В интервале μ + 3σ находится 99,73%, практически все значения признака.

Статистическая надежность, или уровень вероятности – это площадь под кривой, ограниченная от среднего на t стандартных отклонений, выраженная в процентах от всей площади. Иными словами, это вероятность появления значения признака, лежащего в области μ + t σ. Уровень значимости – это вероятность того, что значение изменяющегося признака находится вне пределов μ + t σ, то есть, уровень значимости указывает вероятность отклонения случайной величины от установленных пределов варьирования. Чем больше уровень вероятности, тем меньше уровень значимости.

В практике агрономических исследований считается возможным пользоваться вероятностями 0,95 – 95% и 0,99 – 99%, которым называют доверительными, то есть такие, которым можно доверять и уверенно пользоваться. Так, при вероятности 0,95 – 95% возможность сделать ошибку 0,05 – 5%, или 1 на 20; при вероятности 0,99 – 99% - соответственно 0,01 – 1%, или 1 на 100.

Аналогичный подход применим и к распределению выборочных средних, так как всякое исследование сводится к сравнению средних величин, подчиняющихся закону нормального распределения. Средняя μ, дисперсия σ² и стандартное отклонение σ – параметры генеральной совокупности при n > ∞. Выборочные наблюдения позволяют получить оценки этих параметров. Для больших выборок (n>20-30, n>100) закономерности нормального распределения объективны для их оценок, то есть в области x ± S находится 68,26%, x ± 2S - 95,46%, x ± 3S – 99,73% всех наблюдений. Средняя арифметическая и стандартное отклонение причисляют к основным характеристикам, при помощи которых задается эмпирическое распределение измерений.

Методы проверки статистических гипотез

Выводы из любого сельскохозяйственного или биологического эксперимента нужно оценить с учетом их значимости, или существенности. Такую оценку проводят путем сравнения вариантов опыта друг с другом, либо с контролем (стандартом), или с теоретически ожидаемым распределением.

Статистическая гипотеза – научное предположение о тех или иных статистических законах распределения рассматриваемых случайных величин, которое может быть проверено на основе выборки. Сравнивают совокупности путем проверки нулевой гипотезы – об отсутствии реального различия между фактическими и теоретическими наблюдениями, пользуясь наиболее подходящим статистическим критерием. Если в результате проверки различия между фактическими и теоретическими показателями близки к нулю или находятся в области допустимых значений, то нулевая гипотеза не опровергается. Если же различия оказываются в критической для данного статистического критерия области, невозможны при нашей гипотезе и поэтому несовместимы с ней, нулевая гипотеза опровергается.

Принятие нулевой гипотезы означает, что данные не противоречат предположению об отсутствии различий между фактическими и теоретическими показателями. Опровержение гипотезы означает, что эмпирические данные несовместимы с нулевой гипотезой и верна другая, альтернативная гипотеза. Справедливость нулевой гипотезы проверяется вычислением статистических критериев проверки для определенного уровня значимости.

Уровень значимости характеризует, в какой мере мы рискуем ошибиться, отвергая нулевую гипотезу, т.е. какова вероятность отклонения от установленных пределов варьирования случайной величины. Поэтому, чем больше уровень вероятности, тем меньше уровень значимости.

Понятие о вероятности неразрывно связано с понятием о случайном событии. В сельскохозяйственных и биологических исследованиях вследствие присущей живым организмам изменчивости под влиянием внешних условий появление события может быть случайным либо неслучайным. Неслучайными будут такие события, которые выходят за пределы возможных случайных колебаний выборочных наблюдений. Это обстоятельство позволяет определить вероятность появления как случайных, так и неслучайных событий.

Таким образом, вероятность – мера объективной возможности события, отношение числа благопрятных случаев к общему числу случаев. Уровень значимости показывает вероятность, с которой проверяемая гипотеза может дать ошибочный результат. В практике сельскохозяйственных исследований считается возможным пользоваться вероятностями 0,95 (95%) и 0.99 (99%), которым соответствуют следующие уровни значимости 0,05 – 5% и 0,01 – 1%. Эти вероятности получили название доверительных вероятностей, т.е. таких, которым можно доверять.

Статистические критерии, используемые для оценки расхождения между статистическими совокупностями, бывают двух видов:

1) параметрические (для оценки совокупностей, имеющих нормальное распределение);

2) непараметрические (применяют к распределениям любой формы).

В практике сельскохозяйственных и биологических исследований встречаются два типа опытов.

В некоторых опытах варианты связаны друг с другом одним или несколькими условиями, контролируемыми исследователем. Вследствие этого опытные данные варьируют не независимо, а сопряженно, так как влияние условий, связывающих варианты, проявляется, как правило, однозначно. К такого типа опытам относятся, например, полевое испытание с повторностями, каждая из которых располагается на участке сравнительно одинакового плодородия. В таком опыте сопоставлять варианты друг с другом можно только в пределах повторения. Другой пример связанных наблюдений – изучение фотосинтеза; здесь объединяющим условием являются особенности каждого подопытного растения.

Наряду с этим часто сравнивают совокупности, варианты которых изменяются независимо друг от друга. Несопряженными, независимыми являются варьирование признаков растений, выращенных в разных условиях; в вегетационных опытах повторностями служат сосуды одноименных вариантов, и любой сосуд одного варианта можно сравнивать с любым сосудом другого.

Статистическая гипотеза - некоторое предположение о законе распределения случайной величины или о параметрах этого закона в рамках данной выборки.

Пример статистической гипотезы: "генеральная совокупность распределена по нормальному закону", "различие между дисперсиями двух выборок незначимо" и т.д.

При аналитических расчетах часто необходимо выдвигать и проверять гипотезы. Проверка статистической гипотезы осуществляется с помощью статистического критерия в соответствии со следующим алгоритмом:

Гипотеза формулируется в терминах различия величин. Например, есть случайная величина x и константа a. Они не равны (арифметически), но нужно установить, значимо ли статистически между ними различие?

Существует два типа критериев:

Необходимо отметить, что знаки ≥, ≤, = здесь используются не в арифметическом, а в «статистическом» смысле. Их необходимо читать «значимо больше», «значимо меньше», «различие незначимо».

Метод по критерию t-Стъюдента

При сравнении средних двух независимых выборок применяют метод по t – критерию Стьюдента, предложенный английским ученым Ф. Госсетом. С помощью данного метода оценивается существенность разности средних (d = x₁ – x₂). Он основан на расчете фактических и табличных значений и их сравнении.

В теории статистики ошибка разности или суммы средних арифметических независимых выборок при одинаковом числе наблюдений (n₁ + n₂) определяется по формуле:

S_d = √ S_X1² + S_X2²,

где S_d - ошибка разности или суммы;

S_X1² и S_X2² - ошибки сравниваемых средних арифметических.

Гарантией надежности вывода о существенности или несущественности различий между средними арифметическими служит отношение разницы к ее ошибке. Это отношение получило название критерия существенности разности:

t = x₁ – x₂ / "√ S_X1² + S_X2² = d / S_d.

Теоретическое значение критерия t находят по таблице, зная число степеней свободы Y = n₁ + n₂ – 2 и принятый уровень значимости.

Если t_факт ≥ t_теор , нулевая гипотеза об отсутствии существенности различий между средними опровергается, а если различия находятся в пределах случайных колебаний для принятого уровня значимости – не опровергается.

Метод интервальной оценки

Интервальная оценка характеризуется двумя числами – концами интервала, покрывающего оцениваемый параметр. Для этого следует определить доверительные интервалы для возможных значений средней генеральной совокупности. При этом, x является точечной оценкой генеральной средней, тогда точечную оценку генеральной средней можно записать так: x ± t_0,5*S_X, где t_0,5*S_X предельная ошибка выборочной средней при данном числе степеней свободы и принятом уровне значимости.

Доверительный интервал – это такой интервал, который с заданной вероятностью покрывает оцениваемый параметр. Центр интервала – выборочная оценка точки. Пределы, или доверительные границы, определяются средней ошибкой оценки и уровнем вероятности – x - t_0,5*S_X и x + t_0,5*S_X. Значение критерия Стьюдента для различных уровней значимости и числа степеней свободы приводятся в таблице.

Оценка разности средних сопряженных рядов

Оценку разности средних для сопряженных выборок вычисляют разностым методом. Сущность состоит в том, что оценивается существенность средней разности путем попарного сравнения вариантов опыта. Для нахождения S_d разностным методом вычисляют разность между сопряженными парами наблюдений d, определяют значение средней разности (d = Σ d / n) и ошибку средней разности по формуле:

S_d = √ Σ (d - d) ₂ / n (n – 1)

Критерий существенности вычисляют по формуле: t = d / S_d . Число степеней свободы находят по равенству Y= n-1, где n-1 – число сопряженных пар.

Контрольные вопросы

Что такое вариационная статистика (математическая, биологическая статистика, биометрия)?
Что называется совокупностью? Виды совокупностей.
Что называется изменчивостью, вариацией? Виды изменчивости.
Дайте определение вариационного ряда.
Назовите статистические показатели количественной изменчивости.
Расскажите о показателях изменчивости признака.
Как вычисляется дисперсия, ее свойства?
Какие вы знаете теоретические распределения?
Что такое среднее квадратическое отклонение, его свойства?
Какие вы знаете закономерности нормального распределения?
Назовите показатели качественной изменчивости и формулы их вычисления.
Что такое доверительный интервал и статистическая надежность?
Что такое абсолютная и относительная ошибка выборочной средней, как их вычислить?
Коэффициент вариации и его вычисление при количественной и качественной изменчивости.
Назовите статистические методы проверки гипотез.
Дайте определение статистической гипотезы.
Что такое нулевая и альтернативная гипотеза?
Что такое доверительный интервал?
Что такое сопряженные и независимые выборки?
Как вычисляется интервальная оценка параметров генеральной совокупности?