Электронная библиотека » Георгий Кирьяков » » онлайн чтение - страница 5


  • Текст добавлен: 7 февраля 2024, 16:40


Автор книги: Георгий Кирьяков


Жанр: Математика, Наука и Образование


сообщить о неприемлемом содержимом

Текущая страница: 5 (всего у книги 15 страниц) [доступный отрывок для чтения: 5 страниц]

Шрифт:
- 100% +
Выбор оптимального размера ячейки декластеризации

При выполнении такой декластеризации необходимо решить вопрос о размерах ячейки «идеальной сети». При этом «слишком большая» и «слишком маленькая» ячейки приведут к одинаковому результату, а именно – к выравниванию весов проб.

В случае слишком большой ячейкой все пробы попадают в одну из них и вес каждой пробы в этом случае будет равен 1/N, где N – количество проб. Соответственно, декластеризованное среднее содержание будет равняться исходному среднему содержанию в пробах.

В случае слишком мелкой ячейки каждая проба занимает одну ячейку и вес каждой пробы равен 1 – то есть веса всех проб тоже одинаковы. Соответственно, декластеризованное среднее, так же, как и при варианте с одной ячейкой на всю рассматриваемую площадь, содержание будет равняться исходному среднему содержанию в пробах.

Вопрос о выборе размера ячейки «идеальной сети» зависит от типа кластеризации.

Если данные кластеризованы случайным образом (есть области скопления проб, никак не связанных с их содержаниями), размер ячейки выбирается так, чтобы в областях с низкой плотностью опробования на одну ячейку приходилось приблизительно по одной пробе.

В случае же подозрения на наличие связи между содержанием и плотностью сети выполняется взвешивание по нескольким вариантам, задаваемым пользователем. Для этого производится построение графика зависимости среднего содержания от различных вариантов размера ячейки. Давайте рассмотрим самый простой вариант, при котором анализируемые размеры ячеек сети декластеризации по всем трем осям одинаковы.


Зависимость среднего содержания золота от размера ячейки сети декластеризации. Четко видно минимальное взвешенное среднее содержание


Обратите внимание, что первые два варианта размера ячеек приводят к одному и тому же результату, поскольку и при ячейке 1х1х1 м, и при ячейке 2х2х2 м внутрь каждой из них попадает только 1 проба. Соответственно, вес у всех проб будет равен единице, и взвешенное среднее содержание будет равно исходному среднему содержанию. Далее можно заметить, что при размере ячейки сети декластеризации 7х7х7 м достигается минимальное взвешенное среднее содержание. После данного значения взвешенное среднее содержание начинает стремиться к исходному среднему содержанию и достигает его при наличии только лишь одной ячейки на всю рассматриваемую площадь, т. е. 1000х1000х1000 м.

Но на практике мы можем получить куда более интересные графики, на которых могут просматриваться два и более минимальных взвешенных средних содержаний.


Зависимость среднего содержания золота от размера ячейки сети декластеризации. Выделяются два минимальных взвешенных средних содержаний


Рекомендуется не ограничиваться выбором единых размеров ячеек по всем трем осям, а анализировать всевозможные варианты. В таком случае по оси X на данном графике следует отображать не размер ячейки декластеризации, а объем ячейки декластеризации, т. е. размер по оси X * размер по оси Y * размер по оси Z.

В результате серии взвешиваний в распоряжении геолога оказывается набор данных, которые можно представить как пары «объем ячейки декластеризации / средневзвешенное содержание». График, построенный в этих двух осях, может быть близким к одному из показанных ниже вариантов.


Зависимость между объемом ячейки и средневзвешенным значением не просматривается. Вероятнее всего, декластеризация не нужна


При увеличении объема ячейки происходит закономерное снижение средневзвешенного значения. Требуется декластеризация для компенсации влияния кластеризации в области высоких содержаний


При увеличении объема ячейки происходит закономерное повышение средневзвешенного содержания. Требуется декластеризация для компенсации влияния кластеризации в области низких содержаний


После принятия решения о необходимости декластеризации необходимо определить размер ячейки, которая будет использована для декластеризации. Существует два подхода к определению такого размера:

– По соответствующей зависимости выбирается размер ячейки, при котором взвешенное среднее минимально (в случае наличия области высоких содержаний) или максимально (в случае наличия области низких содержаний). Если вернуться к нашему первому, самому простому, случаю, то оптимальная ячейка декластеризации там составит 7х7х7 м. Если же у нас наблюдается два и более минимальных взвешенных средних содержаний, как во втором примере, то выбираем наименьший размер ячейки декластеризации, при котором наблюдается минимальное взвешенное среднее содержание, т. е. 50х50х50 м.

– По соответствующей зависимости выбирается размер ячейки, при котором взвешенное среднее содержание стабилизируется (график начинает выполаживаться).


Выбор оптимальной сети декластеризации, при котором среднее содержание «стабилизируется», т. е. график начинает выполаживаться


Рекомендуем к прочтению данную статью:

https://github.com/andrey-vyaltsev/ResourceGeologistBasic/blob/main/DeclusterDebias.pdf

§ Задание 1.5

Заполните пропуски в предложении. Выберите все правильные варианты.


В случае, если кластеризация происходит на участках с «…», увеличение размеров ячейки декластеризации ведёт к «…» взвешенного среднего содержания.


A. высоким содержанием, снижению.

B. низким содержанием, повышению.

C. высоким содержанием, повышению

D. низким содержанием, снижению.

Проверка качества декластеризации

Какой бы метод декластеризации ни использовался, обязательным условием является проверка качества проведенного процесса. Наилучшие способы – это визуальный анализ весов проб и сопоставление гистограмм.


Пробы с легендой по весам декластеризации


Гистограмма по исходным данным и по данным с учетом весов декластеризации


Процесс декластеризации является подготовительным шагом для последующего анализа:

– Оценка уровней «ураганных» значений содержаний.

– Помощь в подготовке моделей вариограмм. Декластеризация может изменить среднее и дисперсию и повлиять на модели вариограмм.

– Проверка достоверности оценки (сравнение средних).


§ Задание 1.6

Скачайте1515
  https://github.com/andrey-vyaltsev/ResourceGeologistBasic/blob/main/Decluttering_simulator.xlsx


[Закрыть]
 и изучите тренажер декластеризации. Поэкспериментируйте с различным расположением бедных и богатых проб. Попробуйте добиться изображенных ниже видов графика.


Ответьте на вопросы:

– В каком случае график будет выглядеть как на рисунке A?

– В каком случае график будет выглядеть как на рисунке B?

– В каком случае график будет выглядеть как на рисунке C?


A


B


C

Композитирование

Давайте представим ситуацию: в некотором профиле пройдена серия скважин, опробование которых выполнено неравными секциями.


Разный интервал опробования у скважин


Ситуация, вероятно, знакомая каждому геологу и встречаемая практически на каждом месторождении. Давайте теперь заменим изображение каждой пробы ее центром.


Центры проб в виде точек


Как говорится, «что-то мне это напоминает». А напоминает эта картина не что иное, как ситуацию кластеризации: сгущение сети опробования в одних участках и разрежение в других. Как уже говорилось, кластеризация крайне негативно влияет на оценку статистических характеристик выборки – приводит к смещению среднего, дисперсии и т. д. И вряд ли это можно признать удачной ситуацией. С этим необходимо бороться. Бороться, выполняя процедуру декластеризации. Декластеризация применительно к данным опробования в пределах выработок называется композитированием. Композитирование – метод декластеризации, направленный на выравнивание весов проб вдоль разведочных выработок и обеспечивающий сопоставимое влияние проб на статистические характеристики. Если пробы отбирались с различными интервалами, появляется риск возникновения систематической ошибки при анализе исходных данных и последующем статистическом анализе.

При выборе оптимальной длины композита следует обратить внимание на то, что:

– Композитированные интервалы должны быть настолько близки к фактическим интервалам опробования, насколько это возможно. Обычно в качестве длины композита выбирается доминирующая длина интервала пробы.


Доминирующая длина пробы выбирается в качестве длины композита


– Если все пробы имеют одинаковую длину, нет необходимости составлять композитные данные.

– Следует построить диаграмму рассеяния в координатах «длина пробы/содержание». Диаграмма должна ответить на вопрос «есть ли связь между длиной пробы и содержанием?». Нередки случаи опробования визуально «более интересных» участков более короткими секциями. Эту особенность необходимо выявить на как можно более раннем этапе. Рассмотрим две подобных диаграммы. В варианте «а» во всех классах длин проб присутствуют практически любые содержания: от низких до высоких. В то же время, в варианте «б» видно, что более короткие пробы – около 0.2—0.4 м показывают преимущественно высокие содержания (облако «красных» точек в верхнем левом углу диаграммы), тогда как более длинными секциями (1.75 м и длиннее) опробованы более бедные участки (облако «синих» точек в правом нижнем углу диаграммы). Данная особенность опробования должна быть учтена при работе с данными. При этом необходимо помнить, что запись в финальном файле опробования не всегда идентична пробе. Например, в ПО Datamine в большинстве случаев статистическая обработка выполняется с использованием так называемого «файла скважин», представляющего собой результат соединения файлов опробования, координат устьев и инклинометрии. И рядовые пробы в таком файле нередко бывают разбиты на несколько записей.


Графики, помогающие определить наличие зависимости содержаний золота от длины пробы


– Длина композитной пробы должна быть кратной исходному интервалу опробования, чтобы свести к минимуму ненужное усреднение через границы проб. Например, если в большинстве интервалов длина пробы составляет 2 м и вы установите длину композита равной 3 м или 5 м, то это приведет к разрыву интервалов опробования. Так делать категорически не рекомендуется. И подобная рекомендация вызвана довольно простым соображением: если пробу длиной, предположим, 2 м с содержанием, предположим, 5 г/т, разбить на 2 интервала по 1 м, то нет никакой уверенности в том, что если бы мы в реальности опробовали данный интервал пробами длиной 1 м, то получили бы две пробы с одинаковым содержанием 5 г/т в каждой. Мы же могли получить как, предположим, 9 г/т и 1 г/т, так 6 г/т и 4 г/т. Любое сочетание содержаний, которое в среднем дает 5 г/т. То есть в результате разбивки длинных интервалов на более короткие мы получим массив данных с недостоверными содержаниями. Зато если объединить два интервала по 1 м с содержанием в одном 4, в другом 6 г/т, то можно быть уверенным в том, что в полученном 2-м композите будет содержание 5 г/т. То есть в описанной выше ситуации для того, чтобы интервалы опробования не разрывались, мы должны брать длину композита кратную 2 м.


Разрывы интервалов опробования. Цветом показаны содержания


– Дробление длинных интервалов на более короткие также приводит к искажению изменчивости. Например, если в большинстве интервалов длина пробы составляет 2 м и вы установите длину композита равной 1 м, то это приведет к созданию большого количества искусственных интервалов опробования с одинаковыми значениями полезного компонента, тем самым исказив реальную изменчивость содержаний.


Создание искусственных интервалов опробования. Цветом показаны содержания


– Можно составлять композиты большей длины, чем интервал пробы. Обычно это приводит к снижению дисперсии и сглаживанию вариограмм. Однако это также снижает количество данных, с которыми можно работать.

– При сопоставимой частоте встречаемости длин проб преимущество отдается максимальной длине.


При сопоставимой частоте встречаемости длин проб преимущество отдается максимальной длине


§ Задание 1.7

К чему обычно приводит выбор длины композита большей, чем интервал опробования? Выберите все правильные варианты.


A. Уменьшению количества проб для последующего анализа.

B. Сглаживанию вариограмм.

C. Повышению дисперсии.

D. Снижению дисперсии.

§ Задание 1.8

Наблюдается ли на данном графике зависимость содержаний от длины интервала опробования?


A. Да, низкие содержания приурочены к длине пробы 2 метра.

B. Нет.

C. Определить невозможно

D. Да, высокие содержания приурочены к длине пробы 2 метра.


Задание 1.8

Методы композитирования

Существует два основных метода композитирования:

– Композитирование от устья к забою скважины:

• без учета границ доменов;

• с разрывами на границах доменов.

– Композитирование по уступам.


Композитирование от устья к забою скважины без учета границ доменов

Если границы доменов имеют постепенные переходы, то может применяться композитирование данных по стволу скважины без зонального контроля по доменам. Этот метод может также использоваться, когда расположение границ доменов является неопределенным. При композитировании и объединении частей смежных проб в одну все числовые поля пересчитываются. Поэтому если вы кодировали какие-то характеристики (руда/порода, зоны, рудные тела и т. п.) фиксированными числовыми кодами, то после композитирования все эти данные изменятся.


Композитирование без зонального контроля по доменам


Композитирование от устья к забою скважины с учетом границ доменов

Если есть понимание того, где именно располагается граница доменов, то необходимо применять композитирование в пределах границ доменов. Это означает, что композитные интервалы проб будут разделяться на границе и не будет размывания данных при переходе через нее.


Композитирование с учетом границ доменов


Еще один способ – составление композитных данных по всей мощности домена. В результате будет получено по одному композиту на пересечение в домене, и все композиты будут различной длины. Данный способ обычно используется когда минерализация представленна маломощными жилами.


Композитирование по всей мощности домена


Композитирование по уступам

Композитирование по уступам часто используется на стадии эксплуатации месторождения. Его рекомендуется использовать, только когда все буровые скважины имеют единое направление или являются вертикальными, а рудное тело пологопадающим. Данный метод не рекомендуется использовать при различной ориентации буровых скважин, так как при этом получается неадекватное представление длины композитов. При различных углах бурения скважин композиты будут иметь различную длину, причем чем сильнее различаются углы бурения скважин, тем сильнее будут различия в длинах проб. В результате этого появляется вероятность введения систематической ошибки при оценке статистических характеристик выборки.


Композитирование по уступам


§ Задание 1.9

В каком случае применяется композитирование данных по стволу скважины без зонального контроля по доменам?


A. Границы доменов имеют постепенные переходы между классами содержаний.

B. У геолога плохое настроение, болит голова и трясутся руки.

C. Границы доменов имеют резкий переход между классами содержаний.

§ Задание 1.10

При каком методе композитирования происходит объединение частей смежных проб из разных доменов в одну пробу? Выберите все правильные варианты.


A. Композитирование от устья к забою скважины по всей мощности домена.

B. Композитирование от устья к забою скважины с разрывами на границах доменов.

C. Композитирование от устья к забою скважины без учета границ доменов.

D. Композитирование по уступам.

§ Задание 1.11

Для какого типа минерализации рекомендуется производить композитирование по всей мощности рудного тела?


A. Штокверк.

B. Жилы с малой мощностью.

C. Жилы с большой мощностью.

Обработка остаточных проб

Существует несколько других факторов, которые необходимо учитывать после выбора длины композитов и метода. Варианты будут меняться в зависимости от программного обеспечения, поэтому вы должны знать, как ваше программное обеспечение обрабатывает эти данные.

Основные факторы включают:

– Обработку потерянных данных количественных анализов или пропусков при опробовании.

– Обработку остаточных проб: остаточные пробы представляют собой интервалы маленькой длины в конце ствола буровой скважины или на границе области, где длина пробы меньше минимальной длины композита.

Варианты обработки остаточных проб:

– все пробы меньше выбранной длины композита отбрасываются. Не рекомендуется к использованию;

– композитированный интервал подбирается как можно ближе к выбранной длине композита путем равномерного распределения длины остаточной пробы по всем композитам (рисунок ниже справа).


Работа с остаточными длинами проб


После проведения композитирования необходимо обязательно провести оценку достоверности проведенных манипуляций. Имеется несколько способов проверки достоверности проведенного композитирования:

– Визуальная проверка содержаний композитов сравнительно с содержанием проб.

– Проверка гистограммы значений исходной и композитированной длины.


Гистограммы исходной и композитированной длины проб


– Проверка соответствия общей длины композитов общей длине проб.

– Сравнение минимального и максимального содержания композитов и исходных проб.


§ Задание 1.12

Закончите предложение. Выберите все правильные варианты.


Минимальное содержание в пробах после композитирования может…


A. Остаться неизменным.

B. Уменьшиться.

C. Увеличиться

§ Задание 1.13

Закончите предложение. Выберите все правильные варианты.


Максимальное содержание в пробах после композитирования может…


A. Остаться неизменным.

B. Уменьшиться.

C. Увеличиться

Урезка ураганных значений
Что такое «ураганное содержание»

Ураганным содержанием принято называть аномально высокое содержание, выделяющееся из основной массы наблюдений. В геологическом словаре ураганное содержание определяется следующим образом: «Проба с весьма высоким содержанием полезного компонента, резко искажающая его среднее содержание и, как следствие, приводящая к искаженной оценке запасов полезного ископаемого» [Геологический словарь, С.-Пб., ВСЕГЕИ, 2010].

Проблема ураганных содержаний – не сугубо специфическая для горнодобывающей промышленности. Наличие значений, резко выделяющихся из некоторого набора данных, присутствует практически во всех областях человеческой деятельности. В статистике такие значения принято называть «выбросами». На взгляд авторов, определение выбросов, приведенное в ГОСТ Р ИСО 5725-1-2002 «Точность (правильность и прецизионность) методов и результатов измерений» несколько лучше отражает суть проблемы: «Элемент совокупности значений, который несовместим с остальными элементами данной совокупности».

Ураганы или выбросы характеризуются следующими особенностями:

– Не отражают (и искажают) свойства руды и процесса рудообразования в данном месте.

– Величина выбросов значительно превышает истинную изменчивость содержаний.

Причины возникновения ураганных содержаний могут быть различны:

– «Человеческий фактор»: от небрежности (ошибки) при пробоотборе/пробоподготовке до небрежности (ошибки) при обработке данных.

– Технические причины: сбой оборудования, брак химических реактивов, программные сбои и т. д. Хотя, по сути, «технические причины» обычно являются следствием предыдущего пункта.

– Природные факторы.

К сожалению, природа возникновения аномального содержания практически никогда не известна. Обычно для возможных мест возникновения ошибки разработаны правила, протоколы действий и проверки, позволяющие свести к минимуму первые две причины (которые, однако, нередко нарушаются), поэтому в данной главе считается, что природа возникновения аномально высокого содержания – чисто природная.

Почему же необходимо ограничивать ураганные содержания? Причины необходимости такого ограничения следуют из определений, приведенных выше. Как правило, выбросы серьезно искажают реальное содержание металлов в сторону завышения. Значимость влияния ураганных содержаний тем выше, чем выше вес каждой пробы при оценке содержаний – т. е. чем реже разведочная сеть. Результат использования ураганного содержания в состоянии «как есть» будет достаточно печальным: завышение содержания со всеми вытекающими последствиями, главным образом – экономическими. Причем, учитывая тот факт, что влияние ураганных содержаний выше на ранних стадиях изучения месторождений, экономические последствия могут быть весьма значительными – вплоть до ошибочного решения об отработке убыточного объекта (убыточных рудных тел).

Таким образом, использовать ураганные пробы «как есть» не стоит и возникает закономерный вопрос «что делать?». И пока вы раздумываете над ответом, предлагаем вам самостоятельно оценить влияние наличия аномально богатых проб на статистические характеристики выборки, путем выполнения задания ниже.


§ Задание 1.14

Для каждой выборки значений содержаний проб рассчитайте:

– Среднее.

– Мода.

– Медиана.

– Дисперсия.

– Стандартное отклонение.

– Коэффициент вариации.


Выборка 1: 0.5, 0.6, 0.7, 0.8, 0.8, 1.5, 1.7, 3;

Выборка 2: 0.5, 0.6, 0.7, 0.8, 0.8, 1.5, 1.7, 10;

Выборка 3: 0.5, 0.6, 0.7, 0.8, 0.8, 1.5, 1.7, 20;

Выборка 4: 0.5, 0.6, 0.7, 0.8, 0.8, 1.5, 1.7, 30;

Выборка 5: 0.5, 0.6, 0.7, 0.8, 0.8, 1.5, 1.7, 50;

Выборка 6: 0.5, 0.6, 0.7, 0.8, 0.8, 1.5, 1.7, 100.


Сопоставьте между собой полученные статистические характеристики и проанализируйте, как влияют экстремально высокие значения содержаний на каждую из статистических характеристик.

Внимание! Это не конец книги.

Если начало книги вам понравилось, то полную версию можно приобрести у нашего партнёра - распространителя легального контента. Поддержите автора!

Страницы книги >> Предыдущая | 1 2 3 4 5
  • 0 Оценок: 0

Правообладателям!

Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.

Читателям!

Оплатили, но не знаете что делать дальше?


Популярные книги за неделю


Рекомендации