Агроэкологическое моделирование

электронный учебно-методический комплекс

МОДУЛЬ 2. Математическое моделирование

Практическое занятие 8-9

Дисперсионный анализ и моделирование

1. Сущность и схема дисперсионного анализа

Дисперсионный анализ основан на работах знаменитого математика Р.А.Фишера (30-е годы 20 в.). Несмотря на достаточно солидный «возраст», данный метод до сих пор остается одним из основных при проведении биологических и сельскохозяйственных исследований. Идеи, положенные в основу дисперсионного анализа, широко используются во многих других методах математического анализа экспериментальных данных, а также при планировании биологических и сельскохозяйственных экспериментов.

Дисперсионный анализ позволяет:

1) сравнивать две или несколько выборочных средних;

2) одновременно изучать действие нескольких независимых факторов, при этом можно определить как эффект каждого фактора в изменчивости изучаемого признака, так и их взаимодействие;

3) правильно планировать научный эксперимент.

Изменчивость живых организмов проявляется в виде разброса или рассеяния значений отдельных признаков в пределах, которые определяются степенью биологической выравненности материала и характером взаимосвязей с условиями среды. Признаки, изменяющиеся под воздействием тех или иных причин, называют результативными.

Факторы, влияющие на степень варьирования результативного признака, делятся на:

1)регулируемые

2) случайные

Регулируемые (систематические) факторы вызываются действием изучаемого в эксперименте фактора, который имеет в опыте несколько градаций. Градация фактора - это степень его воздействия на результативный признак. В соответствии с градациями признака выделяется несколько вариантов опыта для сравнения. Поскольку эти факторы предварительно обусловлены, их называют регулируемыми в исследованиях, т.е. заданными, зависящими от организации опыта. Следовательно, регулируемые факторы – факторы, действие которых изучается в опыте, именно они и обусловливают различия между средними выборочными разных вариантов - межгрупповую (факториальную) дисперсию.

Случайные факторы определяются естественным варьированием всех признаков биологических объектов в природе. Это неконтролируемые в опыте факторы. Они оказывают случайное влияние на результативный признак, обусловливают экспериментальные ошибки и определяют внутри каждого варианта разброс (рассеяние) признака. Этот разброс носит название внутригрупповой (случайной) дисперсии.

Таким образом, относительная роль отдельных факторов в общей изменчивости результативного признака характеризуется дисперсией и может быть изучена с помощью дисперсионного анализа или анализа рассеяния

Дисперсионный анализ основан на сравнении межгрупповой и внутригрупповой дисперсий. Если межгрупповая дисперсия не превышает внутригрупповую, значит, различия между группами имеют случайный характер. Если межгрупповая дисперсия существенно выше, чем внутригрупповая, то между изучаемыми группами (вариантами) существуют статистически значимые различия, обусловленные действием изучаемого в опыте фактора.

Из этого следует, что при статистическом изучении результативного признака при помощи дисперсионного анализа следует определить его варьирование по вариантам, повторениям, остаточное варьирование внутри этих групп и общее варьирование результативного признака в опыте. В соответствии с этим различают три вида дисперсий:

1) Общую дисперсию результативного признака (Sy2);

2) Межгрупповую, или частную, между выборками (Sy2);

3) Внутригрупповую, остаточную (Sz2).

Следовательно, дисперсионный анализ – это расчленение общей суммы квадратов отклонений и общего числа степеней свободы на части или компоненты, соответствующие структуре эксперимента, и оценка значимости действия и взаимодействия изучаемых факторов по F-критерию. В зависимости от числа одновременно исследуемых факторов различают двух-, трех-, четырехфакторный дисперсионный анализ.

При обработке полевых однофакторных статистических комплексов, состоящих из нескольких независимых вариантов, общая изменчивость результативного признака, измеряемая общей суммой квадратов (Сy), расчленяется на три компонента: варьирование между вариантами (выборками) - СV, варьирование повторений (варианты связаны между собой общим контролируемым условием – наличием организованных повторений) - Сp и варьирование внутри вариантов Сz.. В общей форме изменчивость признака представлена следующим выражением:

Сy = СVp + Сz.

Общее число степеней свободы (N -1) также расчленяется на три части:

степени свободы для вариантов (l – 1);

степени свободы для повторений (n – 1);

случайного варьирования (n – 1)* (l – 1).

Суммы квадратов отклонений, по данным полевого опыта – статистического комплекса с вариантами – l и повторениями – n, находят следующим образом. Сначала с помощью исходной таблицы определяют суммы по повторениям - Σ P , вариантам - Σ V и общую сумму всех наблюдений - Σ X.

Затем вычисляют следующие показатели:

Общее число наблюдений N = l * n;

Корректирующий фактор (поправку) Скор = (Σ X1)2 / N;

Общую сумму квадратов Cy = Σ X12 – Cкор;

Сумму квадратов для повторений Cp = Σ P2 / (l –Cкор);

Сумму квадратов для вариантов CV = Σ V2 / (n – 1);

Сумму квадратов для ошибки (остаток) CZ = Cy - Cp - CV .

Полученные суммы квадратов CV и CZ делят на соответствующие им степени свободы и получают два средних квадрата (дисперсии):

Вариантов Sv2 = CV/ l – 1;

Ошибки SZ2 = CZ / (n – 1)* (l – 1).

Оценка существенности разностей между средними

Полученные средние квадраты используют в дисперсионном анализе для оценки значимости действия изучаемых факторов путем сравнения дисперсии вариантов (Sv2) с дисперсией ошибки (SZ2) по критерию Фишера (F = SY2 / SZ2). За единицу сравнения принимают средний квадрат случайной дисперсии, который определяет случайную ошибку эксперимента.

Применение критерия Фишера позволяет установить наличие или отсутствие существенных различий между выборочными средними, но не указывает конкретных различий между средними.

Проверяемой Ho - гипотезой является предположение - все выборочные средние являются оценками одной генеральной средней и различия между ними несущественны. Если Fфакт = SY2 / SZ2 ≤ Fтеор , то нулевая гипотеза не отвергается. Между выборочными средними нет существенных различий, и на этом проверка заканчивается. Нулевая гипотеза отвергается при Fфакт = SY2 / SZ2 ≥ Fтеор Значение F- критерия для принятого в исследовании уровня значимости находят в соответствующей таблице с учетом степеней свободы для дисперсии вариантов и случайной дисперсии. Обычно пользуются 5% -ным уровнем значимости, а при более строгом подходе 1% - ным и даже 0,1% -ным.

2. Оценка значимости разности между средними по наименьшей существенной разности

Наименьшей существенной разностью (НСР) – является своеобразной ценой деления, разрешающей способностью опыта при оценке разности выборочных средних. Критерий НСР = t0,5 * Sd указывает предельную ошибку для разности двух выборочных средних.

Если фактическая разность больше НСР0,5 (d ≥ НСР0,5), то она значима, существенна, при d ≤ НСР0,5 – несущественна.

Для определения НСР необходимо по данным дисперсионного анализа вычислить обобщенную ошибку средней: Sx = √ S2 / n и ошибку разности средних Sd = √ 2S2 / n. Значения t - критерия для принятого уровня значимости и числа степеней свободы остаточной дисперсии берут из таблицы.

В многофакторном опыте изучается действие и взаимодействие нескольких факторов на изменчивость результативного признака, поэтому каждому фактору задают несколько градаций. Это позволяет изучать действие каждого из них при нескольких градациях других факторов.

Эффект взаимодействия факторов составляет ту часть общей изменчивости, которая вызвана различным действием одного фактора при разных градациях другого. В полевом опыте часто эффект от совместного применения изучаемых факторов может быть выше (синергизм) или ниже (антагонизм) суммы эффектов от раздельного применения каждого из них. В первом случае имеет место положительное, во втором – отрицательное взаимодействие факторов. Если же факторы не взаимодействуют, то эффект от совместного применения равен сумме эффектов от раздельного их применения (аддитивизм).

При дисперсионном анализе данных многофакторного опыта используют те же принципы и расчеты дисперсий, что и при однофакторном. Однако при этом усложняется математическая модель анализа.

При обработке данных двухфакторного опыта сумма квадратов расчленяется на следующие компоненты:

Cy = CA+ CB + CAB + CP + CZ.

Соответственно с указанными компонентами расчленяется и общее число степеней свободы:

N -1 = (lA-1) + (lB – 1) + (lA - 1)* (lB -1) + (n – 1) + (l – 1)* (n – 1).

Вегетационные опыты представляют собой статистические комплексы, состоящие из нескольких независимых выборок (вариантов). Независимость сопоставляемых вариантов достигается регулярным перемещением сосудов на вагонетке. Следовательно, в вегетационных опытах обычно нет территориально организованных повторений. Поэтому в однофакторном вегетационном опыте общее варьирование результативного признака разлагается на два компонента – варьирование вариантов и случайное варьирование и общее число степеней свободы:

Сy = СV + Сz, N – 1 = (l -1) + (N -l).

МЕТОДИЧЕСКИЕ УКАЗАНИЯ К ВЫПОЛНЕНИЮ ПРАКТИЧЕСКОГО ЗАДАНИЯ

ЗАНЯТИЕ 6

ОБРАБОТКА ДАННЫХ ОДНФАКТОРНЫХ ПОЛЕВЫХ ОПЫТОВ

Задача – провести дисперсионный анализ данных однофакторного полевого опыта по индивидуальному заданию согласно следующих рекомендаций:

1. Исходные цифровые данные задачи занести в таблицу 1 и определить:

1) Сумму наблюдений по вариантам - Σ V

2) Сумму по повторениям - Σ P

Обратите внимание – суммы значений по вариантам и по повторениям должны быть равны - Σ x

3) Рассчитать средние значения в каждом из вариантов – x

4) Рассчитать общее число наблюдений в опыте – N

N = число вариантов (l) * число повторностей (п)

5) Рассчитать общую среднюю по опыту – x0

x0 = Σ x / N

*Фактические значения данных опыта – x1, x2, xn

2) Установить произвольное среднее число (начало) – А

Для этого следует вычисленное x0 округлить до целого значения.

3) Преобразовать исходные данные из таблицы 1 , в таблицу 2 согласно формуле:

xа = xn – A, где

xа – преобразованное число

xn – исходные значения в табл. 1

A – произвольное среднее число

Таблица 2 – Отклонения от произвольной средней величины – А

4) Полученные преобразованные значения (отклонения от произвольной средней) возводим в квадрат и подсчитываем сумму квадратов отклонений по вариантам и по повторениям (табл. 3):

Таблица 3 – Квадраты преобразованных значений

5) Затем вычисляют суммы квадратов отклонений в следующей последовательности:

Корректирующий фактор (поправку) Скор = (Σ xа)2 / N;

Общую сумму квадратов Cy = Σ (xа2) – Cкор;

Сумму квадратов для повторений Cp = Σ P2 / (l –Cкор);

Сумму квадратов для вариантов CV = Σ V2 / (n – 1);

Сумму квадратов для ошибки (остаток) CZ = Cy – Cp – CV .

6) После вычисления сумм квадратов отклонений, заполняется таблица результатов дисперсионного анализа (табл. 4)

Таблица 4 – Результаты однофакторного дисперсионного анализа

Вариантов: Sv2 = CV / l – 1;

Остаточное: SZ2 = CZ / (n – 1)?(l – 1)

*Теоретическое значение F05 находят по таблице (см.прил. ), исходя из числа степеней свободы для дисперсий вариантов (числитель) и числа степеней свободы для дисперсии остатка (знаменатель).

При Fфакт. ≤ F05(табл.), нулевая гипотеза подтверждается, существенных различий между средними в опыте нет;

Если Fфакт. ≥ F05(табл.) в опыте есть существенные различия по вариантам, тогда необходимо определить между какими вариантами наблюдаются существенные отличия (оценка существенности частных различий по НСР).

7) Для оценки существенности частных различий вычисляются следующие величины:

- обобщенную ошибку средней: Sx = √ S2 / n

- ошибку разности средних: Sd = √ 2S2 / n

Критерий НСР = t0,5*Sd указывает предельную ошибку для разности двух выборочных средних. Если фактическая разность больше НСР0,5 (d ≥ НСР0,5), то она значима, существенна, при d ≤ НСР0,5 – несущественна.

Значения t – критерия для принятого уровня значимости и числа степеней свободы остаточной дисперсии берут из таблицы (см.прил.1).

Полученные результаты статистической обработки заносятся в итоговую табл. 5:

Таблица 5 – Итоговая таблица дисперсионного анализа

8) На основании полученных данных однофакторного полевого опыта сделать письменные выводы об эффективности того или иного применяемого в опыте агротехнического приема (градации фактора).

Задания для обработки данных однофакторного полевого опыта методом дисперсионного анализа:

1. Обработать методом дисперсионного анализа данные полевого опыта по изучению эффективности нормы высева (млн. всхожих зерен/га) на урожайность (ц/га) озимой ржи (почва – дерново-подзолистая):


Варианты повторения
1234
1 4 млн. 21,323,423,522,0
2 5 млн. 25,524,424,026,3
3 6 млн. 18,919,620,519,9

2. Обработать методом дисперсионного анализа данные полевого опыта по изучению эффективности сроков посева на урожайность (ц/га) яровой пшеницы (почва – чернозем обыкновенный):


Варианты повторения
1234
1 15-20 мая 17,415,916,522,0
2 20-25 мая 21,020,419,526,3
3 25-30 мая 20,419,518,019,9

3. Обработать методом дисперсионного анализа данные полевого опыта по изучению эффективности доз азотного удобрения на урожайность (ц/га) ячменя (почва – серая лесная):


Варианты повторения
1234
1 N30 17,915,515,919,1
2 N50 19,318,719,119,0
3 N70 21,320,521,021,7
4 N90 25,427,126,426,5

4. Обработать методом дисперсионного анализа данные полевого опыта по изучению эффективности полного минерального удобрения на урожайность (ц/га) картофеля (почва – чернозем выщелоченный):


Варианты повторения
1234
1 N30P30K60 170184180194
2 N50P60K90 238214219226
3 N70P90K120 205209197189

5. Обработать методом дисперсионного анализа данные полевого опыта по изучению эффективности сортов на урожайность (ц/га) овса (почва – чернозем обыкновенный):


Варианты повторения
1234
1 Сельма 25,624,424,528,1
2 Таежник 26,927,125,425,9
3 Саян 34,530,932,431,7

6. Обработать методом дисперсионного анализа данные полевого опыта по изучению эффективности ширины междурядий на урожайность зеленой массы кукурузы (ц/га) (почва – светло-серая лесная):


Варианты повторения
1234
1 45см 425411397408
2 90см 560587544559
3 120см 490484471482

7. Обработать методом дисперсионного анализа данные полевого опыта по изучению сроков внесения азотного удобрения под озимую рожь на урожайность (ц/га) картофеля (почва – серая лесная):


Варианты повторения
1234
1 до посева 17,117,817,418,0
2 в подкормку весной 24,327,425,027,0
3 в фазу выхода в трубку 20,119,320,921,6

8. Обработать методом дисперсионного анализа данные полевого опыта по изучению эффективности глубины основной обработки на урожайность (ц/га) яровой пшеницы (почва – чернозем выщелоченный):


Варианты повторения
1234
1 20-22 см 28,429,725,626,3
2 25-27 см 24,421,925,722,1
3 30-32 см 18,719,417,117,7

9. Обработать методом дисперсионного анализа данные полевого опыта по изучению эффективности доз органических удобрений на урожайность (ц/га) капусты (почва – темно-каштановая):


Варианты повторения
1234
1 20 т/га 311340338325
2 40 т/га 347338356340
3 60 т/га 380377365388
4 80 т/га 450468470458

10. Обработать методом дисперсионного анализа данные полевого опыта по изучению эффективности способа обработки почвы на урожайность (ц/га) яровой пшеницы (почва – чернозем обыкновенный):


Варианты повторения
1234
1 20-22см 14,713,217,417,1
2 30-32см 11,912,512,712,4
3 20-22см 20,317,419,319,7
4 30-32см 16,216,015,916,9

11. Обработать методом дисперсионного анализа данные полевого опыта по изучению эффективности предшественников на урожайность (ц/га) яровой пшеницы (почва – темно-каштановая):


Варианты повторения
1234
1 чистый пар 19,319,918,819,7
2 пар кулисный 23,722,122,523,5
3 донник 2 год использов. 15,615,814,314,7

12. Обработать методом дисперсионного анализа данные полевого опыта по изучению эффективности доз полного минерального удобрения на содержание белка (%) в зерне ячменя (почва – чернозем выщелоченный):


Варианты повторения
1234
1 N30P60K40 15,912,612,713,0
2 N45P75K55 13,813,413,612,9
3 N60P90K70 15,814,915,715,9

13. Обработать методом дисперсионного анализа данные полевого опыта по изучению эффективности видов органических удобрений на урожайность кукурузы (ц/га) (почва – темно-серая лесная):


Варианты повторения
1234
1 навоз 55,757,853,055,9
2 сидерат 48,449,345,949,0
3 торфокомпост 52,450,951,251,5

14. Обработать методом дисперсионного анализа данные полевого опыта по изучению эффективности гербицидов на урожайность (ц/га) яровой пшеницы (почва – чернозем обыкновенный):


Варианты повторения
1234
1 Ковбой 29,327,328,226,4
2 ПумаСупер 30,229,429,728,1
3 Логран 34,433,335,233,0

15. Обработать методом дисперсионного анализа данные полевого опыта по изучению эффективности предшественников на урожайность озимой ржи (ц/га) (почва – дерново-подзолистая):


Варианты повторения
1234
1 клевер 19,620,819,219,4
2 горох+овес 17,818,418,116,3
3 рапс 23,325,623,323,7

16. Обработать методом дисперсионного анализа данные полевого опыта по изучению эффективности числа предпосевных культиваций на урожайность (ц/га) яровой пшеницы (почва – чернозем обыкновенный):


Варианты повторения
1234
1 1 20,417,317,919,5
2 2 21,020,520,319,8
3 3 22,923,423,123,9

17. Обработать методом дисперсионного анализа данные полевого опыта по изучению эффективности способа обработки почвы на запасы продуктивной влаги (мм) в слое 0-20 см (почва – чернозем обыкновенный):


Варианты повторения
1234
1 отвальная 18,719,419,019,9
2 плоскорезная 24,324,326,722,6
3 нулевая 20,120,721,320,8

18. Обработать методом дисперсионного анализа данные полевого опыта по изучению эффективности дозы азотного удобрения на фоне фосфорно-калийных удобрений на урожайность (ц/га) яровой пшеницы (почва – чернозем выщелоченный):


Варианты повторения
1234
1 N60P60K60 14,415,613,213,9
2 N90P60K60 17,316,416,216,9
3 N120P60K60 24,325,825,722,0

19. Обработать методом дисперсионного анализа данные полевого опыта по изучению эффективности доз азотно-калийных удобрений на урожайность зеленой массы (ц/га) кукурузы (почва – серая лесная):


Варианты повторения
1234
1 N45K60 311298304319
2 N60K75 380371377394
3 N75K90 411431438449

20. Обработать методом дисперсионного анализа данные полевого опыта по изучению эффективности доз извести на уровень каталитической активности (см3/1г) дерново-подзолистой почвы:


Варианты повторения
1234
1 1 т/га 3,12,83,03,1
2 2 т/га 4,94,74,94,9
3 3 т/га 5,15,05,04,9

21. Обработать методом дисперсионного анализа данные полевого опыта по изучению эффективности доз органических удобрений на скорость продуцирования углекислого газа дерново-подзолистой почвы (г/м2 * сутки):


Варианты повторения
1234
1 10 т/га 4,33,93,73,7
2 20 т/га 5,65,96,76,1
3 30 т/га 7,97,78,47,9

22. Обработать методом дисперсионного анализа данные полевого опыта по изучению эффективности сроков посева на урожайность (ц/га) овса (почва - темно-серая лесная):


Варианты повторения
1234
1 15-20 мая 19,617,117,817,9
2 20-25 мая 20,021,321,421,5
3 25-30 мая 24,325,725,526,8

23. Обработать методом дисперсионного анализа данные полевого опыта по изучению эффективности сроков мульчирования сидеральной массой почвы участка на запасы продуктивной влаги (мм) в слое почвы 0-20 см:


Варианты повторения
1234
1 15 июля 45,051,047,049,0
2 15 августа 41,044,043,047,0
3 15 сентября 31,030,035,036,0

24. Обработать методом дисперсионного анализа данные полевого опыта по изучению эффективности нормы высева ярового рапса на содержание переваримого протеина (%) в зеленой массе рапса:

Варианты повторения
1234
1 2,5 млн. 16,717,017,116,8
2 3,5 млн. 17,117,617,917,1
3 4,5 млн. 14,914,714,814,9

25. Обработать методом дисперсионного анализа данные полевого опыта по изучению эффективности сроков заделки ярового рапса на содержание подвижного органического вещества в дерново-подзолистой почве (С мг/100г):

Варианты повторения
1234
1 15 июля 31,430,732,333,4
2 15 августа 31,933,730,432,9
3 15 сентября 47,845,346,747,7


© ФГОУ ВПО Красноярский государственный аграрный университет

© Центр дистанционного обучения