» » Методы оценки достоверности геологической информации

Методы оценки достоверности геологической информации

02.08.2016

Статистические методы. Анализ результатов прямых измерений и их ошибок базируется на представлении о случайном характере отклонений измеряемой величины от ее истинного значения. Типичной в научных исследованиях является ситуация, когда свойства закона распределения неизвестны и суждения о них должны быть сделаны по результатам самих измерений. Очевидно, что достоверность выводов будет тем выше, чем больше число измерений.
Задачи, которые возникают при обработке многократных прямых измерений одной и той же случайной величины, решаются методами математической статистики. В классической статистике предполагается, что измерения независимы друг от друга. В нестрогом понимании независимость означает, что знание числового значения одного измерения не позволяет судить о числовом значении другого.
Требование независимости измерений не всегда выполняется, особенно при прямых измерениях, связанных с процессом опробования. Независимыми можно считать данные опробования при редкой разведочной сети, т.е. на первых этапах геологической разведки месторождений.
Независимые случайные величины могут подчиняться одному и тому же закону распределения, а следовательно, имеют одни и те же числовые характеристики — математическое ожидание и дисперсию. Этот случай соответствует измерениям в одних и тех же условиях, а сами измерения при этом называют равноточными. Многократное опробование рудного тела не является реализацией равноточных измерений. Так, пробы могут иметь разную длину, различаться по способам отбора (керновые, задирковые, бороздовые и т.п.) и анализа (химический, геофизический).
Поскольку элементы выборки (отдельные измерения) содержат ошибки, измеряемая величина или параметры закона распределения не могут быть вычислены точно. Одна из основных задач математической статистики — задача нахождения приближенных значений числовых характеристик случайной величины. Такие приближенные значения носят название оценок. Принято обозначать оценку параметра той же буквой, что и оцениваемую величину, но с волнистой чертой сверху.
В математической статистике к оценкам предъявляются следующие требования: состоятельность, несмещенность и эффективность. Оценка а величины а по результатам n измерений называется состоятельной, если ее дисперсия с ростом n стремится к нулю, т.е.
Методы оценки достоверности геологической информации

Свойство несмещенности оценки эквивалентно отсутствию систематической ошибки при оценивании а и определяется условием
Методы оценки достоверности геологической информации

т.е. математическое ожидание оценки параметра а равно истинному его значению. За меру эффективности оценки принимается ее дисперсия. Очевидно, что эффективность оценки тем выше, чем ниже дисперсия оценки D(a).
Все перечисленные свойства являются положительными качествами оценок. Для нахождения оценок в статистике используют два основных метода: моментов и наибольшего правдоподобия. Оба метода, как правило, приводят к одним и тем же выражениям для оценок. Наиболее нагляден метод моментов. Суть его заключается в следующем. Пусть для случайной величины X получена выборка x1, x2, ..., хn и требуется найти оценку математического ожидания. В качестве такой оценки выбирают величину а:
Методы оценки достоверности геологической информации

т.е. оценку среднеарифметического.
Для равноточных измерений X такая оценка состоятельна и не смещена. Оценка дисперсии имеет различный вид в зависимости от информации о свойствах закона распределения. Если известна дисперсия измеряемой величины σx2, то при достаточно больших значениях n закон распределения оценки а близок к нормальному с плотностью вероятности
Методы оценки достоверности геологической информации

где а — истинное значение математического ожидания X.
Дисперсия оценки (4.5) будет при этом в n раз меньше дисперсии отдельного измерения:
Методы оценки достоверности геологической информации

Более типична задача о нахождении оценок а и σa2 по результатам n независимых наблюдений. В этом случае несмещенная оценка а выражается формулой (4.5), а оценка дисперсии принимает следующий вид:
Методы оценки достоверности геологической информации

Оценка параметра σa2 в данном случае характеризует погрешность отдельного измерения. Чтобы получить оценку погрешности для серии из n измерений, необходимо воспользоваться формулой
Методы оценки достоверности геологической информации

Оценки параметров по формулам (4.5)—(4.8) носят название точечных. Погрешность оценки среднего значения по формуле (4.5) или (4.7) характеризуется величиной дисперсии σa2 или σa2-. Более содержательные выводы о погрешностях измерении параметров случайных величин можно получить используя интервальные оценки.
Интервальные оценки в математической статистике находят с помощью метода доверительных интервалов. Рассмотрим сущность метода на примере оценки математического ожидания а. Выберем некоторую вероятность а (обычно полагают α = 0,95 или а = 0,99). Определим интервал (а - ε, а + ε), называемый доверительным, так, чтобы выполнялось равенство р{/а-а/≤ε} = α. Смысл равенства заключается в том, что с вероятностью а ошибка в определении а с помощью оценки а не превзойдет по абсолютной величине ε.
Для доверительного интервала (т.е. величины ε) оценки а с помощью формулы (4.5) при известной дисперсии σ2х используют соотношение
Методы оценки достоверности геологической информации

где Ф(z) — функция Лапласа.
В частности, при α = 0,954ε = 2σa =2σx/√n результат удобно записать в виде а = а ± 2σх /√n с надежностью α = 0,95.
Если оценки математического ожидания и дисперсии определяются совместно по формуле (4.7), то интервальная оценка будет иметь другой вид:
Методы оценки достоверности геологической информации

где tα — коэффициент надежности, значение которого находят по специальным статистическим таблицам.
При неравноточных измерениях формулы для вычисления а и σa2 видоизменяются. Пусть, как принималось и ранее, ется n измерении различных случайных величин, характеризующихся одинаковым математическим ожиданием, но различными дисперсиями σк2.
Вместо формулы (4.5) для серии неравноточных измерений при оценке математического ожидания необходимо использовать формулу
Методы оценки достоверности геологической информации

где коэффициенты взвешивания λk удовлетворяют следующим условиям:
Методы оценки достоверности геологической информации

Этим условиям удовлетворяют веса λk, определяемые соотношениями
Методы оценки достоверности геологической информации

При использовании весовых коэффициентов (4.11) дисперсия оценки а вычисляется по формуле
Методы оценки достоверности геологической информации

Если все σк2 равны между собой, т.е. измерения равноточные, то легко заметить, что формулы (4.11) и (4.12) переходят в формулы (4.5) и (4.6). Для ошибок измерений, распределенных по нормальному закону, доверительный интервал находится с помощью равенства, аналогичного равенству (4.9), т.е.:
Методы оценки достоверности геологической информации

где σа находится по формуле (4.13).
При использовании формул (4.11)—(4.13) необходимо иметь в виду, что они справедливы, если известны дисперсии σк2. В противном случае нужно оценивать σк2 по результатам измерений. Так как необходимо учитывать неравномерность измерений, расчеты усложняются. Формулы (4.10) и (4.11) имеют основополагающее значение при обработке результатов геологоразведочных данных при подсчете запасов. Отметим, что все традиционные методы подсчета запасов учитывают неравномерность измерений (опробования) различными приближенными способами. Характер приближения (отличительная особенность метода) связан с определением весовых коэффициентов λk. Обычно веса λk выбираются в соответствии с условием несмещенности Σnλk = 1 и из некоторых геометрических соображений, обусловленных способом разделения рудного тела на блоки при подсчете запасов. При этом эффективность оценки может оказаться несколько ниже оптимальной теоретической, полученной с помощью формулы (4.13).
Рассмотрим связь между ошибками прямых и косвенных измерений, описываемых уравнением (4.2). Будем характеризовать случайную ошибку измерения с помощью дисперсии. Предположив, что отклонения аргументов от их математических ожиданий являются малыми, можно заменить уравнение измерения линейной функцией.
Пусть для простоты уравнение измерения зависит от двух аргументов z = f(x, у). Тогда линеаризация функции f(x, у) будет заключаться в замене точного равенства на приближенное:
Методы оценки достоверности геологической информации

где х = M(X) и у = M(Y) или их оценки.
Выражение для дисперсии переменной z примет следующий вид:
Методы оценки достоверности геологической информации

Если число аргументов больше двух, то расчетные формулы имеют аналогичный вид. При использовании этих формул необходимо учитывать условия, при которых линеаризация допустима.
Геостатистический подход к анализу погрешностей. Использование методов математической статистики при обработке результатов измерений основано на предположении об отсутствии зависимости между двумя любыми измерениями, принадлежащими выборке. Это предположение по отношению к таким измерениям, как результаты опробования, может быть принято весьма приближенно. Тем самым допущение о независимости значений показателей в двух пробах, отстоящих друг от друга на расстоянии h, приводит к погрешности классификации, о величине которой невозможно судить, оставаясь на позициях классической математической статистики.
Обобщение традиционных статистических методов оценивания и анализа погрешностей при зависимых наблюдениях для подсчета запасов связано с представлениями о пространственной изменчивости показателей месторождений. Необходимость строгого описания изменчивости показателя возникает уже при выполнении следующей простой процедуры оценки. Пусть, например, значение показателя в пробе присваивается некоторой точке, отстоящей от данной пробы на некоторое расстояние h. Очевидно, величина ошибки будет зависеть от изменчивости показателя и от расстояния. Чем стабильнее оруденение и меньше расстояние h, тем меньше погрешность такой оценки.
Рассмотренное свойство этой простейшей оценки иногда качественно характеризуется с помощью понятия зоны влияния пробы. Для конкретного месторождения влияние пробы распространяется до известного предела, за которым любое предсказание становится случайным. Размеры зоны влияния пробы будут также определяться размерами самих проб. Например, при малых размерах проб колебания содержаний в них могут быть велики, а с увеличением размеров эти колебания уменьшаются и одновременно увеличивается размер зоны влияния. Таким образом, на величину погрешности оценки влияют размеры материальных проб.
Изменчивость оруденения может зависеть от выбранного направления. Это явление носит название анизотропии и обнаруживается при оценке показателей в различных значениях величины погрешности для различных направлений. При анализе изменчивости выделяют три типа анизотропии: геометрическую, зональную и функциональную. Формальное их отличие связано с количественными методами описания пространственной изменчивости.
При изучении изменчивости оруденения необходимо выделять геологически однородные зоны. Параметры изменчивости, влияющие на погрешности оценок, будут разными для участков с различными геологическими условиями. На однородных участках погрешность оценки не должна зависеть от положения точки (или блока), для которой оценивается показатель.
Описание изменчивости, учитывающее рассмотренные геологические особенности объекта измерения, а также методы анализа погрешностей оценок геологических показателей базируются на прикладной теории случайных функций, которая при решении геологоразведочных задач получила название геостатистики. Основы теории были разработаны еще в начале 40-х гг. XX в. А.Н. Колмогоровым и Н. Винером. Развитие методов применительно к задачам оценки месторождений получило распространение сравнительно недавно благодаря работам Ж. Maтерона.
Рассмотрим некоторые теоретические положения, которые лежат в основе определения погрешностей оценок геологических показателей. Основным допущением в геостатистике служит предположение о пространственном размещении признака в пределах геологически однородного рудного тела как о реализации стационарной случайной функции координат пространства.
Понятие случайной функции (или случайного поля) является обобщением понятия случайной величины. Функция f(х) называется случайной функцией своего аргумента, если ее значение при любом значении x представляет собой случайную величину. Аргумент х считается неслучайным. В общем случае переменная х — векторная величина, зависящая от трех координат пространства, а в простейшем, когда рассматривается одно направление, — скалярная переменная.
При таком определении полное описание случайной функции возможно, если заданы законы распределения бесконечного множества случайных величин J(x) для каждого фиксированного х = x0, а также законы распределений, характеризующих взаимную зависимость случайных величин при различных значениях аргументов. Применительно к задачам обработки геологоразведочных данных такое описание нереально.
Практический интерес представляют собой случайные функции, характеризующиеся некоторыми специальными свойствами. Дополнительное допущение о характере изменения j(x) в геостатистике связано со стационарностью. Предположим, что закон распределения, например плотность вероятности p(f1) в любой точке x1, не зависит от координаты х1 и зависимость между значениями функции f(x) в двух точках x1 и x2 обусловлена лишь расстоянием h между этими точками.
Условие стационарности случайной функции позволяет при изучении проблем оценки и анализа погрешностей ограничиться тремя характеристиками: математическим ожиданием, дисперсией и структурной функцией случайной функции. Для стационарной случайной функции J(x) ее математическое ожидание и дисперсия не зависят от координаты х. По этой причине для их оценки могут использоваться формулы, аналогичные формулам (4.5) и (4.6). Пусть f(xk) — значения показателя f в пробе с координатой xk. Тогда оценки математического ожидания и дисперсии показателя/в пробах вычисляются по формулам
Методы оценки достоверности геологической информации

где n — число всех проб в пределах месторождения или его участка.
Оценки (4.16) являются вспомогательными в геостатистике. Основным инструментом при анализе погрешностей оценок служит структурная функция, определяемая с помощью соотношения
Методы оценки достоверности геологической информации

B приложениях обычно используется функция γ(h) = S(h)/2 , называемая полувариограммой, или просто вариограммой.
Если имеется N(h) пар проб, находящихся на расстоянии h друг от друга, то вариограмма оценивается по формуле
Методы оценки достоверности геологической информации

Обычно экспериментальные вариограммы строятся по ограниченному числу точек, для каждой из которых применяется формула (4.17), и для различных направлений h. Если анизотропия в изменчивости показателя f отсутствует, то вариограммы, рассчитанные для различных направлений, имеют приближенно один и тот же вид. Для численных расчетов используют не оценку (4.17) вариограммы, а ее теоретическую модель, зависящую от небольшого числа параметров.
Наибольшее распространение в приложениях нашла так называемая сферическая модель, для которой уравнение вариограммы имеет следующий вид:
Методы оценки достоверности геологической информации

где C0 — постоянная эффекта самородков; С + C0 — амплитуда явления перехода (порог вариограммы); d — носитель явления перехода (интервал влияния).
Параметры сферической вариограммы наглядно отражают особенности пространственной изменчивости показателя (рис. 4.1). Допустим, что исследуемым показателем является содержание. Тогда постоянная эффекта самородков Co будет характеризовать степень непрерывности оруденения. Наличие скачка в нуле на вариограмме свидетельствует, что существуют разрывы между рудными и безрудными участками, причем линейные размеры их значительно меньше расстояния между пробами. С вероятностной точки зрения эффект самородков свидетельствует о наличии чисто случайной составляющей изменчивости содержаний.
Методы оценки достоверности геологической информации

Наряду с объективными причинами, обусловленными особенностями минерализации, эффект самородков на вариограмме может быть следствием технических погрешностей опробования. Эксперименты показывают, что если на вариограмме обнаруживается эффект самородков и имеется возможность повышения качества опробования (за счет изменения способа отбора проб и повышения точности анализа), то для проб с меньшими техническими погрешностями постоянная эффекта самородка будет меньше.
Значение параметра d вариограммы характеризует размеры зоны влияния пробы. На расстояниях, превышающих значение d, содержания в пробах можно считать взаимно независимыми. Очевидно, что зона перехода (0 < h ≤ d) может быть обнаружена на экспериментальной вариограмме, если среднее расстояние между пробами h много меньше величины носителя перехода d.
Амплитуда явления перехода С + C0 численно равна дисперсии содержаний в точечных пробах, оценка которой σf2 может быть вычислена с помощью формулы (4.16), Следует отметить, что выполнение равенства С+ C0 = σf2 экспериментально наблюдается лишь приближенно, так как оценки вариограммы и дисперсии σf2 — случайные величины и в распоряжении исследователя имеются лишь их реализации.
Основная особенность геостатистических методов при анализе погрешностей — использование теоретической модели вариограммы. Как и в математической статистике, отклонение оценок средних значений содержаний от их истинных значений характеризуется дисперсией. В конечном счете, числовые значения определяемых в геостатистике дисперсий выражаются через параметры теоретической модели. Для сферической вариограммы к таким параметрам относятся Co, С и d. Поскольку изменчивость содержаний может быть разделена на случайную и структурную составляющие, вклад C0 в общую дисперсию может быть учтен отдельно.
Рассмотрим основную задачу анализа погрешностей. Пусть известно среднее содержание z(v) в объеме (области) v. Если f(x) — значение содержания в точке x, то среднее содержание в объеме v определяется с помощью интеграла
Методы оценки достоверности геологической информации

Пусть среднее содержание z(V) в объеме V, который содержит область v, неизвестно. В качестве оценки среднего z(V) принимается известное содержание z(v), т.е. z(V) = z(v).
Погрешность оценивания будет характеризоваться |z(V)-z(v)| или, что удобнее, дисперсией отклонения содержания в объеме V от его оценки. Вычисление этой дисперсии приводит к следующему теоретическому соотношению:
Методы оценки достоверности геологической информации

Дисперсия оценки среднего содержания по объему V с помощью известного среднего по объему v называется еще дисперсией распространения v на V. Для ее нахождения по известной вариограмме y(h) необходимо вычислить интегралы в правой части (4.18). Значения интегралов для основных моделей изменчивости могут быть получены с помощью номограмм, построенных Ж. Матероном.
Наряду с формулой (4.18), важное значение имеет теоретическое соотношение, устанавливающее связь между вариограммой и дисперсией оценки в объеме V по среднему арифметическому в N точках:
Методы оценки достоверности геологической информации

Интегралы от вариограмм в формулах (4.18) и (4.19) представляют собой самостоятельный интерес не только при анализе погрешностей оценок средних содержаний, но и при решении задач планирования и управления добычей. Пусть объем v случайным образом выбирается внутри области объема V и необходимо определить дисперсию содержания в объеме v. Обозначим, как это принято в геостатистике, дисперсию признака в объеме V с помощью символа σ2(v|V). В простейшем случае точечных проб (v = 0) выражение дисперсии точечной переменной в объеме V имеет вид
Методы оценки достоверности геологической информации

Для объема, отличного от нулевого, справедлива формула
Методы оценки достоверности геологической информации

Формулы для вычисления дисперсии составляют основу для анализа достоверности подсчета запасов в блоках и по всему месторождению. В зависимости от способа подсчета запасов разработаны также приближенные процедуры оценивания, базирующиеся на приведенных соотношениях и некоторых приближениях.