Геологическая интерпретация данных комплекса геофизических исследований скважин – сложная задача, имеющая важнейшее практическое значение для поисков и разведки месторождений полезных ископаемых. Она относится к классу обратных задач геофизики, решаемых экспертом-геофизиком в условиях неполной информации.
Промысловая геофизика решает задачи поисков и разведки месторождений полезных ископаемых и входит в состав геологоразведочных работ, проводимых для выявления и оценки запасов минерального сырья. В процессе геологоразведочных работ бурятся поисковые и разведочные скважины, из которых получают образцы горных пород (керн) для изучения состава, структуры и различных петрофизических характеристик геологического разреза. При этом решаются следующие задачи: расчленение геологического разреза; определение горных пород, слагающих геологический разрез; выделение пластов-коллекторов и изучение их свойств; выявление и локализация скоплений различных полезных ископаемых; подсчет запасов полезных ископаемых и т.д.
Во многих случаях отбор керна из скважин технически невозможен или экономически невыгоден, тогда применяется другой метод получения геологической информации, без необходимости отбора керна, – с использованием геофизических исследований скважин (ГИС). Основой ГИС является каротаж, который заключается в измерении вдоль ствола скважины при помощи каротажного зонда или наземных датчиков какой-либо величины, характеризующей физические, химические или другие свойства горных пород, вскрытых скважиной. Сигналы от скважинного прибора передаются на поверхность и регистрируются наземной аппаратурой, установленной обычно на передвижной каротажной станции. Полученный комплекс каротажных диаграмм поступает на обработку геофизику, который при помощи специальных программных средств и на основе собственного опыта производит их расшифровку (геологическую интерпретацию).
В настоящее время бурение любой скважины обязательно сопровождается комплексом ГИС.
Основы теории и практики геологической интерпретации данных геофизических исследований скважин (ГИС) сформировались в 30-70 гг. прошлого столетия. Интерпретация ГИС базируется на математическом и физическом моделировании изучаемых процессов (решение прямых задач геофизики), методах статистического (корреляционного и дискриминантного) анализа, решении систем нелинейных петрофизических уравнений (обратная задача геофизики) и некоторых других линейно-статистических методах. Зависимости каротажных сигналов от расчетных физико-геологических параметров – проницаемости, нефтенасыщенности, глинистости и др. чаще всего имеют сложный нелинейный характер. Кроме того, геофизику необходимо учитывать погрешности измерений сигналов, специфику территории и т.д. Все это позволяет сделать предположение об эффективности применения для решения геофизических задач таких методов Data Mining, как нейронные сети, деревья решений и др., т.к. данные методы обладают свойством адаптивности, обобщения, извлечения знаний и моделирования сложных нелинейных зависимостей в массивах данных.
Несмотря на стремительное развитие компьютерных технологий (в том числе методов машинного обучения) большинство геофизиков редко использует данные методы, полагаясь в сложных ситуациях на свой опыт и интуицию. Вместе с тем, актуальность применения новых высокоэффективных способов геологической интерпретации геофизических данных сейчас возрастает. Это связано, по меньшей мере, с двумя факторами:
Многие отечественные геофизики уже оценили высокую эффективность применения интеллектуальных алгоритмов анализа данных. Например, специалисты НПУ "Казаньгеофизика" используют аппарат искусственных нейронных сетей для распознавания нефтеносных и "пустых" зон по комплексу геофизических и геохимических параметров. Результаты их исследований показывают, что даже простейший многослойный персептрон с одним скрытым слоем обеспечивает корректное решение поставленной задачи с вероятностью более 98% (против 54,3% при классификации традиционным в геофизике методом линейно-статистического анализа с помощью дискриминантных функций). И многослойный персептрон – это лишь один из множества доступных алгоритмов Data Mining на платформе Deductor.
Рассмотрим практическое использование платформы Deductor для решения трех задач промысловой геофизики: расчленение геологического разреза скважины с выделением пластов-коллекторов, идентификация продуктивных коллекторов (водонасыщенные, нефтеводонасыщенные, нефтенасыщенные) и определение коллекторских свойств горных пород на примере прогнозирования коэффициента пористости. Спектр решаемых в геофизике задач, как правило, гораздо шире, однако общий подход к их решению на основе алгоритмов Data Mining одинаков.
Кратко охарактеризуем геофизические методы исследования скважин, данные которых были использованы для подготовки обучающей выборки.
Кроме того, часто используются: метод измерения собственных потенциалов SP, электрометрия с помощью потенциал-зондов PZ, индукционный каротаж IK. На рис. 1 приведена каротажная диаграмма с 5 сигналами.
Используя полученную от геофизика-интерпретатора информацию о выделенных по нескольким скважинам исследуемой территории пластах, можно выявить закономерности между данными ГИС и коллекторскими свойствами (продуктивностью) пластов и в дальнейшем производить геологическую экспресс-интерпретацию каротажных диаграмм новых скважин на основе алгоритмов Data Mining. Для этого воспользуемся инструментом платформы Deductor "Деревья решений", предназначенным для классификации объектов. После подготовки данных по трем скважинам получим обучающую выборку из 2300 точек, часть которых зарезервируем для тестирования полученных решающих правил.
Построенное по данным двух скважин дерево решений для расчленения геологического разреза на коллекторы содержит 8 правил.
Результаты тестирования показали, что для новой скважины модель обеспечивает точность классификации или выделения границ пластов на уровне 75%.
Далее остановимся подробнее на задаче прогнозирования продуктивности коллекторов, которые могут принадлежать к одному из трех классов: "нефтенасыщенный", "водонасыщенный" и "нефтеводонасыщенный".
Для демонстрации снова возьмем реальные данные ГИС из 8 скважин. Для всех коллекторов рассчитаем интегральную характеристику по каждому каротажу, всего получим 278 точек, что и составит обучающую выборку. Воспользуемся другим аналитическим инструментом Deductor – самоорганизующимися картами Кохонена. Количество кластеров в настройках зададим равным трем. Полученные карты изображены на рисунке 3.
Последовательно анализируя различные карты признаков, видим, что определяющей для разделения коллекторов на водоносные и нефтеносные является величина удельного электрического сопротивления по данным бокового каротажа BK. Впрочем, это известный геофизикам факт. Несмотря на то, что обучение проходило без учителя, алгоритм Кохонена сгруппировал большинство нефтеносных пластов в отдельный кластер (кластер 0), в котором усредненная по пласту величина BK имеет средние и высокие значения. Самый большой кластер под номером 2 принадлежит водонасыщенным коллекторам. Ему соответствуют средние и высокие показания кавернометрии DS и акустического каротажа DT. Наконец, в последний кластер под номером 1 вошли нефтеводонасыщенные коллекторы. Для них величины BK и DS принимают низкие значения.
Решим эту же задачу с использованием эмпирических решающих правил (деревьев решений). В обучающей выборке теперь будет присутствовать выходной столбец с известным насыщением пласта. Эта информация предоставляется экспертом-геофизиком.
Модель сгенерировала 12 правил. Для следствия "нефтенасыщенный коллектор" их можно увидеть в таблице 1.
Таблица 1. Правила для следствия "Нефтенасыщенный коллектор"
NN | Условие | Поддержка | Достоверность | ||
---|---|---|---|---|---|
% | Кол-во | % | Кол-во | ||
1 | BK < 24.025 И BK >= 9.81 И NGR >= 1.72 И GR < 2.27 И DT >= 214.33 | 1.5 |
3 |
100 |
3 |
2 | BK >= 24.03 И NGR >= 1.61 И DT < 201.43 И DT < 199.83 | 1.0 |
2 |
100 |
2 |
3 | BK >= 24.03 И NGR >= 1.61 И DT >= 201.43 | 2.5 |
5 |
100 |
5 |
Так же как и карта Кохонена, модель "дерево решений" извлекла 2 правила (правила 2 и 3 в таблице 1), согласно которым при средних и высоких значениях BK однозначно идентифицируется нефтенасыщенный коллектор. Полное дерево решений для классификации типа насыщения приведено на рисунке 4.
Результаты классификации вышеописанными способами удобно сравнивать по таблицам сопряженности.
Таблица 2. Таблица сопряженности (карта Кохонена)
Классифицировано | ||||
---|---|---|---|---|
Фактически | вода | вода+нефть | нефть | Итого |
вода | 239 |
239 |
||
вода+нефть | 7 |
10 |
17 |
|
нефть | 4 |
1 |
17 |
22 |
Итого | 250 |
11 |
17 |
278 |
Таблица 3. Таблица сопряженности (дерево решений)
Классифицировано | ||||
---|---|---|---|---|
Фактически | вода | вода+нефть | нефть | Итого |
вода | 238 |
1 |
239 |
|
вода+нефть | 10 |
7 |
17 |
|
нефть | 4 |
18 |
22 |
|
Итого | 252 |
8 |
18 |
278 |
Из сравнения таблиц сопряженности видно, что водонасыщенные пласты распознаются моделями практически со 100% результатом. Обе модели отнесли 4 нефтяных коллектора к типу "вода". Скорее всего, при интерпретации ГИС этих пластов геофизик-эксперт привлекал априорную дополнительную информацию, которая не содержится в имеющихся обучающих данных. Не исключается также и ошибка геофизика-эксперта. Основные проблемы возникают при классификации нефтеводонасыщенных пластов. Поскольку они занимают промежуточное положение между типами "вода" и "нефть", построенная карта Кохонена и дерево решений относят часть таких пластов к разным типам. Тем не менее, и здесь можно говорить о выделении нефтеносных пластов с результатом, близким к 90%.
Рассмотрим последнюю задачу – прогнозирование коэффициента пористости по данным ГИС с применением алгоритмов Data Mining. Для этого воспользуемся инструментом Deductor "Нейронная сеть". На входы нейронной сети подаются значения геофизических параметров выделенных пластов-коллекторов, выход сети соответствует коэффициенту пористости пласта. Обучающая выборка состояла из 150 точек. Из рисунка 5 видно, что нейронная сеть хорошо выявляет закономерности между данными ГИС и коэффициентом пористости. Традиционно для расчета этого коэффициента геофизику необходимо решить несколько петрофизических уравнений.
Применение методов Data Mining для решения задач геофизических исследований скважин целесообразно по следующим причинам:
Аналитическая платформа Deductor имеет полный набор инструментов для решения геологических, геофизических и геохимических задач средствами Data Mining.