III Международный конкурс
научно-исследовательских и творческих работ учащихся
«СТАРТ В НАУКЕ»
 
     

ПРИМЕНЕНИЕ МАТЕМАТИЧЕСКИХ МЕТОДОВ В ЭКОЛОГИЧЕСКИХ ИССЛЕДОВАНИЯХ ОБЪЕКТОВ РАЗЛИЧНОГО РАНГА
Черных К.Д.
Автор работы награжден дипломом победителя второй степени
Диплом школьника      Диплом руководителя
Текст научной работы размещён без изображений и формул.
Полная версия научной работы доступна в формате PDF


ВВЕДЕНИЕ

На современном этапе развития научных исследований становится явно недостаточно провести простое описание изучаемого явления. Обязательным требованием является такая форма результата, которая может быть применена на практике в виде математической модели, программного продукта и т.п. Учитывая это, в качестве основного метода исследования были выбраны математические методы.

В настоящей работе приводятся методы математической статистики и корреляционно-регрессионный анализ, примененные для анализа экологических опытов.

Прежде чем выполнять математические расчёты в любой системе, необходимо отметить, что математический анализ отличается объективностью и динамичностью.

В настоящее время становится всё более закономерным увеличение доли математических методов в современных исследованиях, именно поэтому тема исследования актуальна.

Целью работы является обоснование применения основных математических методов в экологических исследованиях.

Реализация цели осуществляется через ряд задач:

  • изучить литературные источники по теме исследований;

  • собрать статистический материал, провести опыты и наблюдения;

  • обработать данные и написать научную работу.

В работе обобщены и систематизированы данные, полученные из фондовых источников Кинель- Черкасского района, НИИ «ВолгоГипрозема», и собственных наблюдениях, выполненных на базе школьного научного общества.

  1. СТАТИСТИЧЕСКАЯ ОБРАБОТКА ДАННЫХ ЭКОЛОГИЧЕСКОГО ОПЫТА

В экологических исследованиях отдельных растительных объектов, планктона, растительных сообществ, для выяснения правильности измерений и их объективности применяют различные математические методы. Более подробно остановимся на статистических методах [7, 10].

По завершении опыта и после получения всех данных встаёт вопрос о достаточности измеренных значений для того, чтобы делать выводы и выдвигать гипотезы. Хотя и говорят, что существуют в порядке возрастания ненадежности: вруны, заклятые лжецы и статистики, но рано или поздно приходится обращаться к статистике для истолкования полученных данных. Статистический анализ не только подтверждает полученные результаты, но, что более важно, он может реально помочь выполнению программы исследований. При умелом использовании статистики статистика поможет определить, действительно ли данные означают то, что хотелось бы получить, помогает полнее осмыслить исследование, чего иногда нельзя добиться иным путем, и часто может сэкономить время и труд, намечая последующие опыты.

  1.  
    1.  
      1.  
        1. 1.1 СТАТИСТИЧЕСКИ ДОСТОВЕРНЫЕ ЧИСЛА

Для опыта требуется проведение серии измерений конечной длины стеблей растения, например, молодых растений бальзамина, произрастающих в различных экологических условиях. Мы тщательно измерили длину 11 стеблей растений линейкой с миллиметровой шкалой и каждое измерение указали в миллиметрах.

Результаты этого опыта приведены в таблице 1.

Таблица 1.

Результаты опытов по измерению длины стеблей растений

Окончательная длина стебля, мм

Окончательная длина стебля, мм

14

16

15

19

13

20

11

19

10

15

18

 
Независимо от вопроса о статистической достоверности этих данных, следует рассмотреть вопрос о точности полученных числовых данных.

При измерении длины стебля очевидно наличие какой-то неустранимой погрешности, которую обычно считают равной примерно ±0,5 мм. Среднюю длину стебля в исследуемых образцах получают в каждом случае делением суммы всех полученных значений на 11. Точное деление показывает, что ни в одном случае среднее не является целым числом. Средняя длина стебля равна 15,636.... Еще один момент, который следует учесть, - это то, что измерения длины стебля, как бы их ни выражали, используют как таковые.

Если бы потребовалось довести измерения длины до крайнего значения, ее можно было бы выразить с точностью до третьего или даже до шестого знака после запятой. Это было бы бессмысленно, особенно потому, что мы знаем о наличии неустранимой погрешности измерения. Поскольку эта ошибка может составлять ±0,5 мм, вполне оправдано указание среднего значения только до первого знака после запятой или в пределах ошибки измерения, т. е. указание, что средняя длина стебля составляла 15,6 мм.

Вопрос о том, до какого знака следует рассчитывать среднюю величину - один из наиболее часто возникающих перед учеными; стандартной процедурой стало вести расчет до минимально допустимого числа знаков. За исключением особых случаев, все измерения даются не более чем до второго знака после запятой, но даже это может быть рискованным. Правилом является использование наименьшего возможного числа, причем надо быть готовым дать обоснование более чем двум цифрам после запятой [4, 7].

1.2 РЕНДОМИЗАЦИЯ

Помимо трудностей, связанных с получением однородных экспериментальных систем, должен 'быть решен вопрос о размещении повторностей. Даже при наилучших условиях вполне возможны небольшие колебания микроклимата (температура, свет, влажность, ветер и т. д.) на различных участках площади. Например, в полевых опытах на рост растений могут сильно влиять разница в плодородии почвы, рельеф местности, степень загрязнения и т. д. В лаборатории у многих термостатов или камер для выкрашивания также имеются различия в микроклимате от точки к точке. Поскольку необходимо иметь достаточное число повторностей для каждой переменной, чтобы численность популяции была статистически достоверной, крайне важно, чтобы все неконтролируемые переменные были устранены. Это и называется рендомизацией.

Предположим, что опыт включает 4 переменных (т.е. 4 разных концентрации ростового вещества, 4 разных сочетания азотистых субстратов, 4 разные длины волны излучения и т. д.). Предположим далее, что все они размещаются на одной и той же площади поля, термостата или камеры для выращивания. Допустим, наконец, что для каждой переменной принято по 4 повторности (или серии повторностей).

Площадь, где ведется опыт, сначала делят на 16 равных частей. Затем нумеруют все повторности (таблица 2).

Таблица 2

Переменная №

Повторность №

1

а,б,в,г

2

а,б,в,г

3

а,б,в,г

4

а,б,в,г

Один из способов избежать пристрастности в размещении повторностей заключается в том, что в шапку кладут 16 пронумерованных кусочков бумаги и размещают каждую из 16 повторностей согласно вытянутому номеру.

Второй способ называется методом латинского квадрата. Этот квадрат представляет собой распределение из п переменных X п повторностей таким образом, что каждая из , букв встречается один раз в каждом ряду и один раз в каждом столбце. В рассмотренном выше примере пХп размещение будет 4X4 (таблица 3).

Таблица 3

1

2

3

4

а б в г

а б в г

а б в г

а б в г

б а г в.

б в г а

б г а в

б а г в

в г б а

в г а б

в а г б

в г а б

г в а б

г а б в

г в б а

г в б а

Могут быть латинские квадраты 5X5 и т. д., построенные таким же образом.

Разновидностью латинского квадрата является так называемый греко-латинский квадрат, где каждая из переменных имеет свой индекс. Снова взяв тот же пример из четырех переменных, можно использовать греко-латинский квадрат, для рендомизации групп повторностей в рамках переменных (таблица 4) [4, 10].

Таблица 4

а1

б2

в3

г4

б4

а3

г2

в1

в2

г1

а4

б3

г3

в4

б1

а2

Квадрат такого типа можно также увеличить до 5X5, 7X7, 10X10 и т.д., но только не 6X6.

Имеются еще варианты, которыми можно пользоваться. Некоторые ученые пользуются латинским квадратом, в котором размещение повторностей производится по ходу какой-либо шахматной фигуры, например коня или слона. Они удобны в тех , случаях, когда возможно постоянное отклонение в определенной позиции. Примером может служить квадрат 5X5, полученный ходом коня (таблица 5).

Таблица 5

Латинский квадрат

Греко-латинский квадрат

Квадрат ходом коня

а б в г д

а1 б2 в3 г4 д5

а б в г д

б а д в

б4 в5 г1 д2 а3

г д а б в

г в г а д

в2 г3 д4 а5 б1

б в г д а

б г д б

г5 д1 а2 б3 в4

д а б в г

а в д в г

д3 а4 б5 в1 г2

в г д а б

Третий способ рендомизации - использование случайных чисел. Таблицы случайных чисел состоят из ряда однозначных чисел, в которых каждое число встречается примерно с одной и то же частотой и распределение которого не подчиняется никаким закономерностям. Таблицы случайных чисел в перестановках, начиная с 6 и выше, можно найти в большинстве книг по математике. Пример можно видеть в таблице 6.

Таблица 6

5

5

6

7

1

4

1

2

8

2

9

3

3

2

9

7

9

7

4

3

1

6

9

6

5

6

4

4

3

3

6

8

7

8

1

7

3

2'

1

9

4

2

8

5

5

8

1.3 СТАНДАРТНЫЕ ОТКЛОНЕНИЯ

В любой серии измерений имеется высокая степень вероятности, что не все из полученных значений будут одинаковыми в любом данном варианте. Частично это обусловлено, как мы уже видели ранее, изменчивостью, свойственной самому биологическому объекту вследствие его генетической структуры, небольшими колебаниями в окружающих условиях и в самих вариантах. К этим источникам изменчивости или неопределенности можно еще добавить ошибки измерения [5].

Обычно довольно важно уметь выразить эту изменчивость математическими или статистическими терминами так, чтобы иметь некоторое представление о рассеивании значений в ту или иную сторону от средней величины. Наиболее частым критерием рассеивания изменчивости служит так называемое стандартное (или средне-квадратичное) отклонение. Пример вычисления стандартного отклонения приведен ниже. Предположим, что подсчитывается число растений на площади 1 м, чтобы получить представление о растительном покрове большой территории. Допуская, что климат и т. д. совершенно одинаковы на всей территории, исследователь выделит 10 участков по 1 м и подсчитает числу растений на каждом из них. Полезно иметь представление о том, каковы могут быть отклонения в численности (таблица 7).

Таблица 7

Число растений на 1 м2

130

60

120

170

160

130

140

140

120

90

Среднее число растений получают, сложив все цифры в колонке и разделив их на п, т. е. число измерений: 1260: 10=126.

Хотя среднее число равно 126 растений на единицу площади, ясно, что имеются колебания от 170 до 60 растений/м2. Вычислив стандартное отклонение, можно выразить эту изменчивость.

Стандартное отклонение (часто обозначаемое сокращенно 5.0.) получают, разделив сумму всех отклонений от средней величины, возведенных в квадрат, на число наблюдений минус 1, и извлекая затем квадратный корень из этого числа. Математически это будет выглядеть так:

Д.S.=∑∆

Возвращаясь к рассмотренному примеру можно составить приводимую ниже таблицу 8. Следует помнить, что эта операция должна быть проделана со всеми использованными числами или значениями вне зависимости от того, будут ли отклонения отрицательными или положительными, поскольку при возведении в квадрат знаки устраняются. Сумма третьей колонки составляет 8740. Это число делят затем на число измерений, уменьшенное на единицу, т. е. на п-1 = 9; отсюда 8740:9=971. Теперь для того, чтобы получить стандартное отклонение, нужно извлечь квадратный корень из 971. Для наших целей можно округлить квадратный корень из 971 до 31. Это число 31 и будет являться стандартным отклонением для десяти определений числа растений на 1 м . В таблицах его обычно приводят как среднее число плюс или минус стандартное отклонение, т. е. 126+31 растений/м2.

Таблица 8

Число расте­ний на 1м2

Отклонения от среднего (∆)

Квадрат отклонения от среднего (∆)

Число растений на 1 м2

Отклонения от среднего

(∆)

Квадрат отклонения от среднего

(∆)

130

4

16

60

66

4356

120

6

36

170

44

1396

160

34

1196

130

4

16

140

14

196

140

14

196

120

6

36

90

36

1296

1.4 СТАТИСТИЧЕСКАЯ ДОСТОВЕРНОСТЬ

В большинстве экологических опытов необходимо знать не только масштабы изменчивости в серии повторностей, но и уметь судить о том, насколько «реальны» различия, выявленные между переменными или среди них. В некоторых случаях это видно на глаз. Например, если вариант а способствует росту, а вариант 6 нет, то можно полагать, что разница между а и б реальна (если это действительно единственные переменные величины). Ответы типа «да» или «нет», хотя желательны, но их редко получают и, как правило, получают ответ типа «может быть». Оценку этого «может быть» называют определением статистической достоверности. В основном, статистическая достоверность свидетельствует о том, что имеется вероятность реальности наблюдаемых различий. Экологи, сознающие неизбежную изменчивость биологического материала и прекрасно зная, что незначительная разница в схеме опыта и условиях его проведения может сильно повлиять на результаты, решили принять лишь определенные уровни вероятности в качестве указания на реальность различий. Например, если в серии повторных опытов установлено, что вариант а отличается от варианта б только один раз из десяти, было бы глупо настаивать, что вариант а действительно отличается от варианта б. Если же, с другой стороны, вариант а дал результаты, последовательно и значительно отличающиеся от результатов в варианте б, то вероятно, что они действительно различны. Вопрос заключается лишь в том, где подвести черту [4,5,7,10].

Имеется ряд статистических методов, которыми можно пользоваться для оценки полученных данных, причем большинство их достаточно просты, чтобы оправдать их применение в большинстве экологических опытов. Математическое обоснование разных методов не входит в задачи данного исследования.

Здесь можно проиллюстрировать лишь два важных примера. Предположим, что проводится сравнение влияния интенсивности накопления свинца на удлинение стебля фасоли. Вариант а состоял из 25 растений, выращиваемых при содержании ниже кларка, а в варианте б растения выращивали при содержании выше кларка. Были приняты достаточные меры для контролирования факторов, как генетических, так и внешней среды, и рендомизации повторностей. После измерения длины стеблей были вычислены средняя длина стебля и стандартное отклонение от среднего:

Варианта а 15,0+1,4 см

вариант б 8,0 + 0,8

Разница между этими средними (15,0 - 8,0) равна 7,0, а среднее из двух стандартных отклонении равно 1,1. Разделив разность между средними на среднее стандартное отклонение, мы получим меру отношения оцениваемой разницы, которая в данном опыте составляет 7,0:1,1 = 6,36. Это очень большая разница, показывающая, что различия между повторностями малы по сравнению с разницей между вариантами. Чтобы определить, насколько они малы, следует обратиться к таблице 9, где указаны пределы статистической достоверности для отношений различий.

Таблица 9

Отношение оцениваемых различий

Уровень статистической достоверности,

%

Отношение оцениваемых различий

Уровень статистической достоверности,

%

1.28

20

2,58

1

1.64

10

2,81

0,5

1,96

5

3,09

0,2

2,33

2

3,29

0,1

Можно видеть, что разница между вариантами а и б статистически достоверна при уровне еще меньшем, чем 0,1%.

Во втором примере ставится опыт по сравнению влияния двух источников питательных веществ на рост гриба. Снова, при достаточном числе повторностей и внимательном подходе к рендомизации и другим факторам, опыт проводят и определяют вес сухого вещества, рассчитывают, как обычно, стандартное отклонение и получают следующие результаты:

вариант а ... 18,1 ±2,1 мг сухого вещества

вариант б.... 14,7+1,9» » »'

Здесь разница между средними равна 3,4 мг, а среднее стандартное отклонение равно 2,0. Отношение оцениваемых различий равно 3,4:2,0=1,70. Справка по таблице статистической достоверности покажет, что это отношение значимо достоверно где-то между 10%-ным и 20%-ным уровнями.

Итак, в первом опыте разница была достоверной при уровне, лучшем 0,1%-ного, в то время как во втором опыте результаты были достоверны примерно при 15%-ном уровне. Это значит, что если бы первый опыт повторили 1000 раз, то, вероятно, в 999 случаях установили бы разницу между вариантами. Короче говоря, можно быть уверенным, что наблюдаемая разница, видимо, реальна. Во втором примере повторение опыта, скорее всего, покажет, что в одном из семи опытов не будет установлено никакой разницы. Короче, нельзя быть уверенным, что разница реальна.

В экологии принято, что достоверными результатами можно считать только те, для которых уровень статистической достоверности (которая фактически является мерой вероятности) равен по меньшей мере 5%, т. е., что только в одном из каждых 20 опытов не будет установлено разницы. Вероятность, что разница реальна, будет возрастать при уменьшении уровня до 1%, 0,1 % и т. д.

  1. КОРРЕЛЯЦИОННО-РЕГРЕСИОННЫЙ АНАЛИЗ В ЭКОЛОГИЧЕСКИХ СИСТЕМАХ

В экологических исследованиях более высокого ранга для выявления закономерных взаимных влияний используется корреляционно-регресионный анализ [8] и метод построения классификационных образов [9].

Построение уравнения регрессии сводится к оценке ее параметров. Для оценки параметров регрессий, линейных по параметрам, применяется метод наименьших квадратов. Он позволяет получить такие оценки параметров, при которых сумма квадратов отклонений фактических значений результативного признака у(хi) = а + bх от теоретических значений минимальна, т.е.

. (1)

Тесноту связи изучаемых явлений оценивает линейный коэффициент парной корреляции, принимающий значение от [-1 ;1]:

Для оценки качества полученной модели используется коэффициент детерминации, который показывает долю дисперсии, объясняемую регрессией, в общей дисперсии результативного признака.

Оценка статистической значимости полученного уравнения регрессии проводится путем прохождения F-теста, который состоит в проверке гипотезы Но об отсутствии статистической значимости уравнения регрессии и показателя тесноты связи. Для этого выполняется сравнение фактического Fфакт и критического (табличного) Fmaбл значения F-критерия Фишера.

Если Fmабл