Расчеты по методу математической статистики



Применение любых математических методов в геологии и геохимии основано на возможности представления геологического объекта в целом или его отдельных признаков в виде определенным образом выбранных математических моделей.
Математическая модель реального объекта пo М.С. Цхелишвили должна удовлетворять следующим требованиям:
1) наиболее полно отражать все характерные черты реального объекта в условиях поставленной геологической задачи.
Это требование является исключительно важным и его следует пояснить. При петрологическом описании, например, гранитного массива необходимо в первую очередь установить набор слагающих его различных пород, их взаимоотношения, характер контактов, вторичных изменений и т.д. Инженерно-геологические исследования на этом же массиве носят иной характер, В данном случае массив представляется как совокупность пространственных участков, обладающих различной прочностью, трещиноватостью, водопроницаемостью и т. п. При мелкомасштабных металлогенических работах массив будет рассматриваться как однородное тело, обладающее определенными средними характеристиками. Все эти особенности изучаемого объекта в условиях различных задач должны быть отражены в математической модели;
2) быть наиболее простой из всех возможных для решения данной задачи;
3) обеспечивать решение поставленной геологической задачи с помощью известных методов математики или приводить к наиболее простому математическому решению.
Выбор математической модели является очень важным, но не достаточным при применении математических методов в геологических исследованиях. Дополнительно требуются:
4) четкая постановка геологической задачи, для решения которой необходимо применение математических методов;
5) формулировка задачи в формальном виде, т. е, с использованием уже не геологических объектов и понятий, а их математических аналогов;
6) решение задачи в формальном виде с использованием математических средств;
7) интерпретация результатов применения математических методов с обязательным учетом упрощений и допущений, принятых при выборе моделей.
В связи с тем что настоящий раздел посвящен применению методов математической статистики, ниже будут приведены основные математические модели, пригодные для применения статистических методов. Объектом математической статистики являются случайные события, случайные функции, в общем все понятия теории вероятностей. Таким образом, используя аппарат математической статистики, мы должны подбирать модели для реальных объектов из теории вероятностей.
Основным понятием теории вероятностей является «случайная» величина. Она называется случайной, если при единичном изменении ее мы не можем точно предсказать возможное значение этой величины (интуитивное определение). Случайная величина обычно обозначается греческими малыми или заглавными буквами — ξ, ψ, η, Ξ, ψ, и т. п. Все возможные значения одной случайной величины образуют ее генеральную совокупность. Несмотря на то, что величина имеет случайный характер, поведение ее значений подчиняется вполне определенным законам. Так, вся совокупность случайной величины полностью описывается ее функцией распределения. Функция распределения случайной величины ξ обозначается обычно F (х) или P (ξ≤х). Последнее означает, что вероятность случайной величины принимается как значение меньшее или равное некоторому аргументу х. Функции распределения случайных величин по своему характеру могут быть отнесены к какому-либо из изученных известных законов. Наиболее распространенными законами распределения являются: нормальный, логнормальный, биномиальный, Пуассона, Пирсона, Фишера, Стыодента и т. д. Каждая функция распределения, в зависимости от принадлежности к тому или иному закону, определяется одним, двумя, тремя или более параметрами. Применение статистики в петрохимических исследованиях может быть основано на представлении петрохимического состава изучаемого объекта в виде многомерной случайной величины.
Особенности моделей распределения здесь не рассматриваются. Заинтересованному читателю можно рекомендовать работы Д.А. Родионова, И.П. Шарапова и др.
Подбор нормальной и логнормальной модели распределения. Модель нормального распределения является наиболее простой и с проверки ее соответствия выборочным данным необходимо начинать исследование геохимической совокупности.
Подбор модели распределения осуществляется путем проверки предложения о соответствии модели наблюдаемому соотношению в реальной выборке.
Первый из рекомендуемых методов подбора модели распределения основан на следующем. Известно, что если нормальная модель распределения не противоречит наблюдаемым данным, то математическое ожидание оценки первого абсолютного момента:
Расчеты по методу математической статистики

Математическое ожидание оценки коэффициента асимметрии Mγ1=0. Упомянутые оценки имеют следующий вид:
Расчеты по методу математической статистики

Процедура проверки гипотезы о соответствии модели и эмпирических данных заключается в следующем. Положим, что в распоряжении исследователя имеется выборка объема n, т. е. X1, X2, ... Xi, ..., Xn (табл. 5). По формулам определяются необходимые оценки. После вычисления d и γ1 по таблицам снимаются значения математического ожидания Md и стандартного отклонения для оценок d и γ2, т. е. √Dd и √Dγ1, соответствующие числу наблюдений п. Заканчивается процедура определением значений для величин:
Расчеты по методу математической статистики

Их можно назвать мерой асимметричности и мерой эксцессивности эмпирической кривой распределения для исследуемой выборочной совокупности. В случае, когда справедлива гипотеза о соответствии нормальной модели эмпирическим данным, величины t1 и t2 представляют собой значения величины, распределенной асимптотически нормально с параметрами 0 и 1.
Расчеты по методу математической статистики

Это означает, что если при установленном уровне значимости 0,05 обе величины не превысят 1,96, то гипотеза о применимости нормальной модели для описания исследуемой выборочной совокупности может быть признана состоятельной, В случаях, когда хотя бы одна из величин t1 или t2 превысит допустимый уровень, равный в данном случае 1,96, гипотезу о применимости нормальной модели следует отбросить как несоответствующую наблюдаемым данным.
Расчеты по методу математической статистики

В табл. 6 приведен пример проверки гипотезы о соответствии нормальной модели распределения TiO2 в лавах алнейской серии на Камчатке. После суммирования данных, составляющих содержанке 2-й графы, вычисляется среднее арифметическое X. Для удобства вычислительных операций разности между значениями X1 и X умножаются на 10. В связи с тем что конечным результатом является получение величин, нормированныхsв соответствующих степенях, производить обратный переход нет надобности. После определения соответствующих сумм величин, находящихся в 3-й и 4-й графах, вычисляются оценки d и s2. Это дает возможность подсчитать величину t1, которая сопоставляется с допустимым значением, равным 1,96. Если t1 ≥ 1,96, то вычисления заканчиваются. Если t1 ≤ 1,96, то процедура продолжается. В этом случае подсчитывается сумма значений, расположенных в графе 5, вычисляются γ2 и t2. Сопоставление величины t2 с 1,96 завершает процедуру. В нашем случае t1 = 0,09, что значительно меньше 1,96 и t2 = 0,32, т. е. обе величины и t2 менее допустимого значения. Это дает право исследователю признать нулевую гипотезу состоятельной, т. е. использовать для описания выборочной совокупности содержаний TiO3 нормальную модель распределения.
Подбор логнормальной модели аналогичен подбору модели нормального распределения. Отличие состоит лишь в том, что исследователь в рассматриваемом случае имеет дело не с эмпирическими данными, а с логарифмами этих данных.