Обработка растровых данных для ML-индикации оруденения. Или как можно сэкономить миллиарды на геологоразведке

Моя цель - предложение широкого ассортимента товаров и услуг на постоянно высоком качестве обслуживания по самым выгодным ценам.

Всем добрый день. Представляю вашему вниманию метод обработки первичных данных для последующего практического применения методов машинного обучения (ML) с целью индикации вероятной локализации оруденения.

История уходит в недалекий 2018 год, когда с развитием цифровых технологий зародилась идея о том, что нужна не просто «указка», где искать, а некий вероятностный индикатор, чтобы он как бы подсвечивал вероятные участки оруденения. В данной статье представлен разбор двух успешных кейсов, как следствие применения данной разработки.

Сначала о самом методе. Метод довольно прост в исполнении. В геологии в открытом доступе имеется множество карт разной информативной наполненности (см. источники).

В основу получения данных легли растровые изображения геологических карт. Это может быть склейка из нескольких карт, фотография, скан. Главное — парсинг итогового изображения в слои данных «маскировки». Маскировка является закрашенным контуром какого-либо признака. Это могут быть магнитные аномалии, линии разломов, массивы кислых или основных горных пород, дифференциация пород по временным характеристикам и так далее, которые именуем признаками.

Следующим этапом является обработка «замаскированных» слоев признаков — создание матриц ближайших расстояний от каждой. Ключевой момент в обработке данных — применение формулы подсчета ближайшего расстояния от точки поля до точки признака.

Принцип алгоритмической обработки растровых изображений в данном методе
Принцип алгоритмической обработки растровых изображений в данном методе

Подготавливаемые изображения должны быть соотнесены друг с другом, затем их частично высвечивают, чтобы исключить появление последующих артефактов. В качестве маски используется цвет черный (0, 0, 0). Дальнейшее приведение использования методов машинного обучения опускаются, поскольку речь идет главным образом о самом подходе к подготовке данных.

Как обработка данных выглядит на примере одного обработанного слоя признака:

Исходный растр данных (геологическая карта)
Исходный растр данных (геологическая карта)
Маскировка (слева) и результат преобразования маски признака в карту расстояний (справа)
Маскировка (слева) и результат преобразования маски признака в карту расстояний (справа)

Карты расстояний в совокупности являются в геологии аналогом сильно усредненных ореолов распространения энергии и вещества.

Простая реализация алгоритма подготовки данных
import warnings
warnings.filterwarnings('ignore')

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

from PIL import Image
# загрузка изображения геологической карты с маской одного признака
img = np.asarray(Image.open('Figure.png').convert('RGB'))
# приведение всего растра слоя к таблице датафрейма
result = pd.DataFrame({'x': [], 'y': [], 'l': []})

for y in np.arange(len(img)):
    
    for x in np.arange(len(img[y])):
        
        if sum(img[y][x]) == 0:
            result.loc[result.shape[0]] = [x, y, 1]
        else:
            result.loc[result.shape[0]] = [x, y, 0]
# разделяем маску от поля точек
zeros_data = result[result['l'] == 0]
ones_data = result[result['l'] == 1]
# разные варианты представлены для демонстрации модификаций использования расстояний
variant = 1

# главный алгоритм
for i1, (x1, y1, l1) in zip(zeros_data.index, zeros_data.values):
    
    if zeros_data.loc[i1, 'l'] != 0: continue
    
    # пул всех расстояний до точки
    pool_distance = []
    
    for i2, (x2, y2, l2) in zip(ones_data.index, ones_data.values):
        
        pool_distance.append(
        ((x1 - x2) * (x1 - x2) + (y1 - y2) * (y1 - y2))**.5
        )
    
    # простое правило - ближайшее расстояние до точки
    if variant == 1:
        zeros_data.loc[i1, 'l'] = np.min(pool_distance)

    # предпоследнее или другое значение - 
    # как способ защиты от одиночных случайных точек
    elif variant == 2:
        zeros_data.loc[i1, 'l'] = np.sort(pool_distance)[1]

    # среднее по нескольким близким расстояниям - возможность сглаживания
    elif variant == 3:
        zeros_data.loc[i1, 'l'] = np.mean(np.sort(pool_distance)[1:101])
# сводим в готовый слой данных для ML
result_data = pd.concat([zeros_data, ones_data]).sort_index()
# сохраняем новый слой данных
result_data.to_csv('new_fuature', index=False)

Ниже представлены практические результаты применения данного метода в формате презентаций

Кейс № 1. Региональные поиски золотого оруденения в Свердловской области.
Слайд 1. Обзорная карта
Слайд 1. Обзорная карта

В качестве исходных данных были использованы две склеенные геологические карты, схема расположения которых по номенклатуре листов — P-40-XXX и P-40-XXXVI, также прилагаемые карты магнитных аномалий, тектонические карты и карта локализации известных рудопроявлений золота. Данные были преобразованы в карты расстояний описанным выше способом с использованием дополнительных фильтров (к примеру, логарифмирование). Разметка данных обучения содержала четыре класса данных: промышленные месторождения, рудопроявления, пункты минерализации и «пустота». Данные были разделены на тренировочные и тестовые выборки.

Слайд 2. Преобразование данных
Слайд 2. Преобразование данных

В результате была получена «золото‑вероятностная» тепловая карта, позволяющая обратить внимание на отдельные ее области.

Слайд 3. Результаты прогнозирования натренированной модели.
Слайд 3. Результаты прогнозирования натренированной модели.

Здесь на слайде 3, выделен один из перспективных объектов — потенциальное оруденение в районе р. Вижай. Также здесь приводятся данные, поднятые с отчетов предшественников в сравнении с прогнозом обученной модели по картам расстояний.

кстати...

Название реки «Вижай» с санскрита переводится как Победа — Виджай

Слайд 4. Таблица данных предшественников о районе.
Слайд 4. Таблица данных предшественников о районе.

Давайте рассчитаем ресурсный потенциал по золоту Вижайского рудного поля. По данным предшественников, в районе выделено несколько потенциальных рудных зон, перспективных на золотометальное оруденение. Рудоносная формация — терригенная черносланцевая, рудная формация черносланцевая золоторудная, геолого‑промышленный тип руд — золото‑сульфидно-кварцевый.

Слайд 5. Наглядное представление о геологической изученности района.
Слайд 5. Наглядное представление о геологической изученности района.

Слайд 6. Сравнение объектов-эталонов
Слайд 6. Сравнение объектов-эталонов

Сурьинский рудный узел и Оленевское рудное поле едва ли имеют одинаковую золотоносную продуктивность, так как обстановки разные и, соответственно, геолого-промышленные типы тоже разные. Рудовмещающие пачки сланцев Сурьинского рудного узла формировались в позднем рифее в нестабильной прибрежной обстановке, тогда как рудовмещение Оленевского рудного поля имеет девонский возраст, условия формирования — коллизия.

Сурьинский рудный узел расположен в пределах Ишемирской минерагенической зоны, в то время как Вижайское и Оленевское рудные поля расположены в пределах Западно-Тагильской минерагенической зоны.

В геологическом строении толщ Оленевского и Вижайского рудных полей принимает участие Войкаро-Кемпирсайский тектоногенный комплекс. По этим причинам и другим причинам Автором настоящего проекта был пересчитан металлоносный потенциал рудных зон Вижайского рудного поля, который составил порядка 130 т. Глубина оценки: 150 метров.

Слайд 7. Сходство обоих рудных объектов
Слайд 7. Сходство обоих рудных объектов

Выдвинем аналогичное предположение:
площадь Оленевского рудного поля: 6,5 км. * 0,4 км. = 2,6 кв.км.
удельная продуктивность Оленевского рудного поля: 51 т. /2,6 кв.км. = 16,7 т/кв.км., где
ресурсы категории P3 — 51 т.;
16,7 — Удель ная продуктивность рудной зоны эталонного объекта;

Итого предполагаемые ресурсы с учетом продуктивности эталонного объекта составили: 26 кв.км. * 16,7 т/кв.км. * 0,3 = 130 т.,
где
26 — суммарная площадь двух потенциальных золоторудных зон Вижайского рудного поля, выделенных автором (см. приложение 6);
0,3 — коэффициент достоверности прогноза;

В результате предполагаемый ресурсный потенциал Вижайского рудного поля— 130 тонн Au металла, подсчитанный методом аналогии.

Кейс № 2. Региональные поиски медного оруденения в Красноярском крае.

Территориально объект расположен на юге Красноярского края, в 100 км от областного центра

Слайд 1. Обзорная карта расположения объекта
Слайд 1. Обзорная карта расположения объекта

В данном кейсе рассмотрим Тасеевский потенциальный медно-рудный узел. С помощью машинного обучения исследуем весь медно-рудный узел, который является на сегодняшний день слабоизученным.

В строении Таеевского узла принимают участие осадочные породы так называемой Тасеевской серии. Синклинорий сложен измененными отложениями верхнего протерозоя и прорванными интрузивными образованиями Синийского и Токминского комплексов. Основные усилия предшественников были сосредоточены на южную часть узла. Так по результатам поисков была выделена Ологашская площадь. В пределах площади было выявлено множество геохимических аномалий по халькофильным элементам и ряд пунктов медной минерализации и рудопроявлений. Предшественники отметили более 300 геохимических ореолов меди размерами до полукилометра с максимальными содержаниями 0,1%. Присутствие урана в породах тасеевской серии добавило гриф секретности проводимым поисковым работам, который позже был снят.

Слайд 2. Геологическая обстановка Антоновская и Ологашская площади
Слайд 2. Геологическая обстановка Антоновская и Ологашская площади

Ресурсный потенциал Ологашской площади по разным оценкам составляет порядка от 8 — 20 млн. тонн Cu металла.

Слайд 3. Меденосный потенциал Ологашской площади
Слайд 3. Меденосный потенциал Ологашской площади

Как стало известно, предшественниками была оставлена без внимания вся средняя и северная часть Тасеевского узла. В целях выявления дополнительных перспективных площадей использовался метод компьютерного моделирования — машинное обучение.

В качестве признаков обучения использовались карты расстояний до разломов, расстояния до зон халькофильных аномалий и расстояния до ближайших выходов магматических пород. В качестве целевой переменной использовались данные о геохимических аномалиях, пунктах минерализации и рудопроявлениях меди. Здесь я привожу результаты анализа всему Тасеевскому узлу.

Слайд 4. Маскировка признаков и конвертация слоев признаков в карты расстояний
Слайд 4. Маскировка признаков и конвертация слоев признаков в карты расстояний
Слайд 5. Результаты прогнозирования обученной модели. Желтый контур - границы Центральной площади
Слайд 5. Результаты прогнозирования обученной модели. Желтый контур — границы Центральной площади

Таким образом была выявлена перспективная Центральная площадь, которая находится в контуре антоновской площади. К счастью, в границах антоновской площади предшественники-уранщики пробурили скважины прямо по западному флангу Тасеевской серии, таким образом вскрыв полный разрез Тасеевских отложений. Так удалось оценить меденосный потенциал на данной площади, взяв бортовое содержание 0,35%. Таким образом, предполагается ресурсный потенциал на Антоновской площади в 1,6 миллиона тонн меди.

Слайд 6. Центральная площадь. Результаты подсчетов ресурсного потенциала по Антоновской площади
Слайд 6. Центральная площадь. Результаты подсчетов ресурсного потенциала по Антоновской площади

Хотелось бы отметить, что по результатам работ на Антоновской площади электроразведка методом переходных процессов здесь хорошо сработала. В аномалиях выявляется медное оруденение, и этому есть подтверждения. Так, при заверке выявленных геофизических аномалий скважинами 2112, 2120 и 2140 были вскрыты горизонты медного оруденения. Согласно рекомендациям машинного обучения, я выделил Центральную площадь размером в 120 квадратных километров, в пределах которой также выделяются рудопроявления меди и возможны геофизические аномалии.

Слайд 7. Разрезы по скважинам с содержанием халькофильных элементов. Зеленый - медь.
Слайд 7. Разрезы по скважинам с содержанием халькофильных элементов. Зеленый — медь.

По итогу прогнозируется в пределах Центральной площади 6,9 миллионов тонн меди со средним содержанием в 1,69%

Слайд 8. Подсчет прогноза ресурсного потенциала Центральной площади
Слайд 8. Подсчет прогноза ресурсного потенциала Центральной площади

Резюме
С помощью данного подхода к обработке растровых данных удалось получить интересный вероятностный индикатор для уменьшения области поисков минеральных ресурсов.

Результатом практического применения данного индикатора прирост ресурсного потенциала минерально-сырьевой базы сообщества Хабр составил:
+ 130 тонн золота
+ 6,9 млн. тонн меди

Источники

интернет ресурсы растровых геоданных
Государственные геологические карты России
Карта прогнозных ресурсов категории Р3

кейс № 1
1.Петров Г.А, Ильясова Г.А., Останин С.Ю., Тристан Н.И., Е.Н.Михалёва и др. Геологический отчет по объекту “ГДП-200 в пределах Северо-Уральской площади (лист Р-40-XXXVI)” за 2003-2006 гг.

2.Зубков А.И, Прогнозно-поисковые работы на благородные металлы (золото, платина) на площади листов P-40-XXX, P-40-XXXVI (Средний и Северный Урал)» за 2001-2004гг. Екатеринбург, 2004 г.

3.Петров Г.А, Ильясова Г.А., Останин С.Ю., Е.Н.Михалёва и др. Отчет о результатах работ по объекту “ГДП-200 листа Р-40-XXX (Тохтинская площадь)”, 2014г.

кейс № 2
1.Моргун В.Н, Отчет Букарской партии Ивановской экспедиции о поисках меди в междуречье рек Верхний и Малый Курыш в 1960-61 гг. (м-б 1:50000, листы 0-46-XXXV, XXXVI)

2.Домаренко В.А, Оценка перспектив ураноносности зоны структурно-стратиграфического несогласия Восточной части Ангаро-Канского выступа Енисейского кряжа. Отчет Саянской экспедиции № 53 о результатах прогнозно-поисковых работ м-ба 1:200000-1:50000 и крупнее по геолог.заданию 53-15 за 1986-1990 гг.

3.Семеняко В.В, Результаты геохимических поисков масштаба 1:50000 в Ангаро-Канской части Енисейского кряжа на Немкинской площади. Отчет Богунайской партии о результатах геохимических поисков масштаба 1:50000, проведенных в 1989 - 1991годах на Немкинской площади.

4.Заблоцкий К.А, Информационный отчет по производству ГГС масштаба 1:50 000 с общими поисками на площади листов О-46-129-Б; 130-А,Б,В,Г (Немкинская площадь) за 1991-1994 гг.

5.Зуев В.К, Создание комплектов Государственной геологической карты масштаба 1:1000000. ФГУГП «Красноярскгеолсъёмка» , ФГУП «ВСЕГЕИ». 2005 г.

6.Зуев В.К, Государственная геологическая карта Российской Федерации. Масштаб 1 : 1 000 000 (третье поколение). Серия Ангаро-Енисейская. Лист O-46 – Красноярск. Объяснительная записка

Источник: https://habr.com/ru/articles/750756/


Интересные статьи

Интересные статьи

Здравствуйте. В этой статье хотел бы разобрать кейс создания резервных копий. Я опишу свои методы, и прошу Вас поделиться опытом о том, как Вы решали данные задачи.  Я опишу самые простые техноло...
Совместные программы лояльности крупных компаний — это настоящее и будущее маркетинга. Но чтобы запустить интересную и релевантную интеграцию, которая зайдет общей аудитории и принесет деньги обеим ко...
Всем лучи добра! Меня зовут Владимир Маркиев, я -- технический писатель в Docsvision. Расскажу вам о двух Docs as Code инструментах. На случай, если вы делали документацию в ворде или ещё где-то, а те...
Привет! На связи Артемий – Analytics Engineer из Wheely.Сегодня хотел бы поговорить о вопросах конвертирования финансовых показателей в разные валюты. Вопрос достаточно актуальный, так ка...
Доброго времени суток, Хабр! Разработка промышленного контроллера с дисплеем для сбора и анализа данных, а также для управления нагрузками, объединенными в группы. Кому интересно, что из э...