Оценка информативности признаков: два подхода, две идеологии
Вяткин Виктор Борисович, старший научный сотрудник Центральной научной библиотеки Уральского отделения Российской Академии наук
Геологическая эффективность прогнозно-количественных построений, выполняемых при оценке перспектив рудоносности территорий, в значительной степени зависит от того, каким образом определяется информативность признаков, как количественная характеристика их прогнозно-поисковой значимости и какая идеология при этом реализуется.
( Общеизвестно, что при одном и том же исходном картографическом материале в зависимости от того, по каким правилам осуществляется прогнозирование, один и тот же рудный объект может быть выявлен или пропущен, а какой-либо безрудный участок – выделен в качестве перспективного или забракован. )
В настоящее время существует два основных подхода к оценке информативности признаков, за каждым из которых стоят своя идеология и непосредственные способы определения информативности: вероятностный и синергетический. (Синергетика – одна из наиболее молодых научных дисциплин, предметом познания которой являются самоорганизующиеся системы, закономерности их становления и развития, а также особенности их взаимоотношений с окружающей средой, то есть с другими системами.)
Вероятностный подход. Идеология вероятностного подхода длительный период времени являлась по существу безальтернативной парадигмой, согласно которой, чем чаще наблюдается признак у эталонных рудных объектов и чем менее он распространен на исследуемой территории в целом, тем большее значение должна иметь его информативность ( J ). Формулы расчета информативности при вероятностном подходе функционально учитывают как общую площадь исследуемой территории, так и все известные в ее пределах автономные проявления признаков, независимо от того, фиксируют они рудные эталоны или нет. То есть, вводя обозначения: N – общее количество объектов распознавания ( элементарных ячеек, на которые делится территория в процессе прогнозно-количественных построений ); М – общее число объектов, на которых проявлен оцениваемый на информативность признак; Х – количество эталонных (рудных) объектов распознавания; Z – число эталонных объектов, фиксируемых признаком; имеем, что при вероятностном подходе J = f ( M, N, X, Z ). Собственно процесс оценки информативности признаков развивается при этом по цепочке: рудный эталон ® признак ® территория ® информативность.
Анализ идеологии вероятностного подхода и стоящих за ним расчетных формул позволяет сделать критические замечания принципиального характера, к основным из которых относятся следующие.
1) Получаемые значения информативности являются эклектичными по своему содержанию, поскольку качественному своеобразию отношений рудных эталонов с их отражающими признаками ставятся в соответствие условия прогнозирования (поиска) их аналогов. Поясним это примером. Пусть рудные эталоны непосредственно взаимосвязаны с тектонически ослабленной зоной, проявленной в виде линейной отрицательной аномалии магнитного поля. На исследуемой территории наблюдается еще n подобных аномалий, геологическая природа которых априорно неизвестна ( они могут быть обусловлены простой литологической дифференциацией толщ ). Не вызывает сомнений, что эти n аномалий и общие размеры территории никакого отношения к данным рудным эталонам не имеют, а включение их в процесс оценки информативности эталонной аномалии (через звено территория) представляет собой механический акт. Практическим следствием такого эклектизма являются неустойчивые, ситуационные значения информативности признаков, которые могут приводить к логически противоречивым общим прогнозным заключениям.
2). В большинстве расчетных формул вероятности встречи признака среди рудных эталонов и на исследуемой территории в целом соотносятся между собой таким образом, что ( Z / X ) > ( M / N ) ® J > 0 и ( Z / X ) < ( M / N ) ® J < 0. В прогнозно-металлогеническом отношении это означает, что если, например, 30 % рудных эталонов находится в толще пород, которая занимает 40 % территории, то эта толща пород будет иметь отрицательную информативность и, соответственно, "играть" на понижение перспектив обнаружения новых рудных объектов. Иначе говоря, алгоритм принятия прогнозных решений в этом случае относится к данной толще, как к фактору, имеющему антирудную направленность и, как следствие, "настраивается" на отрицание и пропуск аналогов 30 % рудных эталонов. ( Подобные явления имели и продолжают иметь место в автоматизированных системах прогнозирования, реализующих вероятностный подход к оценке информативности признаков. )
Синергетический подход. Принципиальным отличием этого подхода от вероятностного является тот факт, что здесь рассматриваются только те проявления признаков, которые имеют непосредственную взаимосвязь с эталонными объектами, а другие их проявления и общие размеры территории при оценке информативности, в общем случае, во внимание не принимаются. Информативность признаков при синергетическом подходе зависит от величины областей ошибок первого и второго рода, наблюдаемых в отражении рудных объектов и увеличивается с их уменьшением. Обозначая через Y количество объектов распознавания, фиксируемых эталонными проявлениями признаков, можно записать, что J = f ( X, Y, Z ), причем Z = 0 ® J = 0 и Z > 0 ® J > 0. Процесс оценки информативности признаков развивается при этом по более короткой, чем в вероятностном подходе, цепочке: рудный эталон ® признак ® информативность. Нетрудно видеть, что отсутствие звена территория в этой цепочке делает оценку информативности признаков при синергетическом подходе свободной от вышеотмеченных недостатков вероятностного подхода.
С гносеологической точки зрения при вероятностном и синергетическом подходах рассматриваются различные типы информационных отношений: субъект-объектные и объект-объектные, соответственно. В субъект-объектных отношениях информация неразрывно связана с управлением и представляет собой снимаемую неопределенность выбора из множества возможностей при актуализации одной из них. То есть, до осуществления выбора из заданного числа возможностей субъект-объектная информация сама по себе объективно не существует. При объект-объектных отношениях информация выступает в качестве атрибута отражения объектов, характеризующего его упорядоченность и для познающего субъекта (геолога) является снятой неопределенностью отражения одного объекта, как единого целого, через взаимодействующий (взаимосвязанный) с ним другой объект (признак). Объект-объектная информация объективно существует в природе независимо от управления и генетически предшествует ему.
Основываясь на изложенном, представляется очевидным, что при определении информативности признаков, в процессе количественной оценки перспектив рудоносности территорий, необходимо отказаться от вероятностного подхода и апеллировать в дальнейшем к синергетическому подходу. В противном случае искажения, при выделении перспективных участков и их ранжировании между собой, будут наступать с фатальной неизбежностью.
Список литературы
Для подготовки данной работы были использованы материалы с сайта http://www.sciteclibrary.ru/