Модель объективной закономерности извлечения информации из окружающей среды
Валентин Ручкин
«Законы науки являются отражением законов природы. Они открываются и формулируются учеными и, следовательно, представляют собой наши знания о законах природы.., иными словами, они являются идеальными (мысленными, понятийными) моделями законов природы» [1].
Раскрыть содержание того или иного объективного закона и сформулировать соответствующий ему научный закон вовсе не просто. История развития науки показывает, что открытие закона природы «обычно происходит не сразу, не до конца, а в форме неполного, приближенного, относительного знания. Лишь в дальнейшем, на каждой последующей ступени развития науки, смысл и содержание объективного закона раскрываются все глубже и полнее, а формулировка соответствующего научного закона постепенно уточняется и становится все более адекватной отражаемому им объективному закону. Это неполное соответствие между научным и объективным законами обусловлено прежде всего сложной структурой самой действительности» [1]. Так например, сначала был сформулирован закон сложения скоростей движущихся тел в рамках классической механики и лишь много лет спустя в релятивистской механике этот закон был существенно дополнен, хотя и классическая механика и релятивистская механика отображают наши знания об одном и том же объекте.
Стоит отметить, что информация является относительно новым объектом, свойства которого изучаются естествознанием, и нет ничего необычного в том, что не все ее свойства изучены достаточно полно.
Лемма Неймана – Пирсона, или как ее еще называют, фундаментальная лемма математической статистики [2] является одним из примеров научного закона, сформулированного на языке математической статистики, которому соответствует объективная закономерность изменения эффективности передачи информации на фоне помех. «... здесь справедливо говорить не о решении математической задачи, а о математическом решении задачи, объектом которой является физическая (материальная) система» [3]. В литературе этот научный закон рассматривается скорее только как лемма математической статистики, а не как модель, отражающая объективную закономерность передачи информации, которой подчиняется широкий класс объектов. Но именно эту объективную закономерность в области передачи информации открыли и описали Нейман и Пирсон в 1928 году, а в 1933 году привели и математическое доказательство своей правоты.
Если передачу информации по каналу связи можно рассматривать как процесс воспроизведения (отображения) на приемном конце (устройстве) букв некоторого алфавита, которые генерирует источник информации [4], то и обработку информации в системах управления различной природы (технических, биологических, социальных) можно рассматривать как процесс воспроизведения (отображения) на выходе устройства обработки некоторых состояний внешней (или внутренней) среды, которым однозначно соответствует та или иная целесообразная реакция системы управления, т.е., в конечном счете, и в этом случае дело сводится к выбору одного состояния из некоторого множества.
Характерно, что и в том и другом случае выбор приходится производить на фоне помех. Таким образом, обнаружение сигналов и измерение их параметров в системах связи и информационно-измерительных комплексах, а также и обработка информации в системах управления могут рассматриваться с единых позиций – позиций решения задачи рационального (оптимального) выбора одного состояния из некоторого множества возможных состояний при наличии искажений (помех) в той информации, на основании которой должен быть произведен этот рациональный выбор.
Многие задачи из различных областей практической деятельности могут рассматриваться как задачи обработки информации или как задачи обнаружения сигналов и оценки их параметров (например, задача ранней диагностики какого-либо заболевания, навигационные задачи).
Фундаментальная лемма математической статистики является теоретическим обоснованием оптимальности многих алгоритмов обнаружения сигналов и оценки их параметров. При этом имеются в виду не только алгоритмы реализованные в технических системах, но и алгоритмы, изложенные в инструкциях и других руководящих документах, которые определяют порядок и логику действий тех или иных должностных лиц при решении практических задач, которые в информационном плане можно рассматривать как задачи обнаружения сигналов и оценки их параметров. Алгоритмы обнаружения сигналов и оценки их параметров, в основу которых положен критерий отношения правдоподобия (байесовский, максимума апостериорной вероятности, Неймана – Пирсона и др.), считаются оптимальными. Такая точка зрения и ее следствия в настоящее время являются общепринятыми и они нашли свое отражение в учебниках, монографиях, справочниках, энциклопедиях и отражены в литературе в виде описаний оптимальных алгоритмов обнаружения, измерения параметров и алгоритмов обработки разнообразной информации, которые воплощены в самых современных технических системах передачи, хранения и обработки информации. Можно предположить, что обработка информации в биологических системах, которые формировались под действием объективных факторов, а не под влиянием тех или иных научных теорий, в большей степени соответствует объективно существующей закономерности передачи информации на фоне помех, чем обработка информации в технических системах.
Формулировка научного закона, приведенная в [5] соответствует той же самой объективной закономерности о которой идет речь в лемме Неймана – Пирсона. Но модель этой объективной закономерности в [5 и 6] существенно отличается от модели той же закономерности, приведенной в лемме Неймана – Пирсона.
Что же общего в этих двух моделях, время появления которых разделяет интервал почти в 70 лет, и чем они отличаются друг от друга?
Для ответа на этот вопрос рассмотрим обе эти модели на примере элементарного акта передачи информации – процесса принятия решения о том, какой именно символ из двух возможных («0» или «1») был передан, на основании наблюдения текущих значений некоторой физической величины (переносчика сигнала) в течение некоторого временного интервала.
Принятие решения о каждом переданном символе производится по результатам нескольких независимых наблюдений (серии измерений) и наблюдателю известны моменты начала и окончания передачи каждого символа.
Результат каждого наблюдения зависит не только от переданного символа, но и от случайного значения помехи.
Наблюдателю известны условные плотности распределения значений наблюдаемой физической величины при передаче каждого символа.
Процедура принятия решения в обеих моделях состоит из трех этапов:
этап 1 – каждому значению x наблюдаемой физической величины, зафиксированному при наблюдении, по определенному правилу ставится в соответствие значение y другой величины;
этап 2 – по результатам серии наблюдений одного временного интервала, в течение которого передается только один из двух возможных символов, вычисляется среднее значение (или сумма значений) y;
этап 3 – полученное среднее значение yср (или сумма значений) сравнивается с некоторым пороговым значением, которое устанавливается (принимается) до начала серии наблюдений, исходя из допустимых вероятностей ошибок первого и второго рода. Результат сравнения однозначно определяет решение («передан символ 0» или «передан символ 1»), которое должно быть принято по серии наблюдений.
По существу, во время первого этапа процедуры принятия решения, наблюдатель переходит от исходной наблюдаемой физической величины (x) к другой, вспомогательной (промежуточной, производной, вторичной) наблюдаемой величине (y), по совокупности значений которой во время заданного интервала времени он и принимает решение о том, какой из двух возможных символов был передан.
Сравниваемые модели различаются между собой лишь правилом, по которому каждому значению x исходной наблюдаемой физической величины ставится в соответствие значение y вспомогательной величины во время первого этапа процедуры принятия решения. То есть, сравниваемые модели различаются только правилом перехода от исходной наблюдаемой физической величины (x) к другой, вспомогательной наблюдаемой величине (y).
В модели Неймана – Пирсона правило такого перехода описывается формулой [4]:
y=ln[W1(x)/W0(x)], (1)
где: y – вспомогательная наблюдаемая величина; W1(x)/W0(x) – отношение правдоподобия; W1(x) – условная плотность распределения значений наблюдаемой физической величины при передаче символа «1»; W0(x) – условная плотность распределения значений наблюдаемой физической величины при передаче символа «0».
В модели 1997 года, описанной в [5, 6], сформулированы требования, которым должна удовлетворять вспомогательная наблюдаемая величина (y) для достижения максимальной эффективности передачи информации на фоне помех. Эти требования состоят в том, чтобы условные распределения вспомогательной наблюдаемой величины (y) соответствовали минимуму выражения (2) [5, 6].
[(s0yzF + s1yzD)/(M1 – M0)] → min, (2)
где: (M1 – M0)>0; s0y – среднеквадратичное отклонение значений y при приеме символа «0»; s1y – среднеквадратичное отклонение значений y при приеме символа «1»; zF – коэффициент, значение которого зависит от допустимых значений вероятности ошибок 1-го рода и вида функции распределения суммы накопленных значений y (на входе порогового устройства) при передаче символа «0» [7]; zD – коэффициент, значение которого зависит от допустимых значений вероятности ошибок 2-го рода и вида функции распределения суммы накопленных значений y при передаче символа «1» [7]; M0 – среднее значение (математическое ожидание) значений величины y при передаче символа «0»; M1 – среднее значение (математическое ожидание) значений величины y при передаче символа «1».
Как видно из (1), в модели Неймана – Пирсона значения вспомогательной наблюдаемой величины (y) зависят только от отношения W1(x)/W0(x) в точке x. В модели 1997 года значения вспомогательной наблюдаемой величины (y) зависят не только от текущего значения исходной наблюдаемой физической величины (x), но и от шести параметров, два из которых определяются допустимыми вероятностями ошибок 1-го и 2-го рода.
В 1913 году Н.Бор сформулировал важный методологический принцип, получивший название принципа соответствия. «Согласно этому принципу всякая более общая теория включает в себя старую теорию: старая теория получается из новой при предельном переходе к определенным значениям определяющих ее параметров. Так, законы квантовой механики переходят в законы классической физики при условии, что можно пренебречь значением кванта действия, а законы теории относительности переходят в законы классической механики при условии, что скорости движущихся тел или частиц малы по сравнению со скоростью света. Следовательно, новая теория не отменяет старую, а лишь уточняет границы, в которых эта старая теория продолжает действовать» [1].
Как показали результаты исследований [8], обобщенный критерий [9], учитывающий закономерность изменения эффективности накопления сигнала двоичного кода [5], при значении параметра сигнал/шум близком к 0 (менее 0,5) совпадает по своим результатам с критерием отношения правдоподобия, хотя значения этих критериев вычисляются по совершенно разным правилам. Зато при значении параметра сигнал/шум порядка 1 и более эти разные правила приводят и к разным результатам: с ростом отношения сигнал/шум эффективность алгоритмов, учитывающих установленную закономерность (т.е. модель 1997г.), существенно возрастает, по сравнению с эффективностью существующих оптимальных алгоритмов, основанных на использовании критерия отношения правдоподобия.
Таким образом, модель объективного закона, которую предложил автор в 1997 году [6], позволила уточнить границы [8], в которых модель объективного закона, предложенная Нейманом и Пирсоном в 1928 году [2], сохраняет свою корректность. Эта граница определяет те предметные области, в интересах которых (в первую очередь) нужно развернуть научные направления по совершенствованию алгоритмов обработки информации – приведению их в соответствие с моделью 1997 года.
Законы науки «делают знания более емкими, содержащими в себе большой запас информации.... В этом смысле закон (независимо от того, в какую-бы сложную математическую форму он ни был облачен) проще того необъятного исходного эмпирического материала, который он заменяет и как бы концентрирует в себе. Причем развитие науки идет по линии установления все более общих и, следовательно, информативно более емких законов, включающих в себя менее общие законы» [1]. Именно таким более общим законом является «закономерность изменения эффективности накопления сигнала двоичного кода» [5].
Предвидение (предсказание) результата того или иного реального действия является необходимой частью любой целенаправленной деятельности, которая включает операцию преднамеренного выбора. И этот выбор в любом случае может опираться только на прошлый опыт независимо от того, в каком виде этот прошлый опыт выступает – выступает ли он в виде обычного житейского «здравого смысла» или в виде самой современной научной теории, обобщающей наши знания в той или иной предметной области (метеорология, земледелие, космонавтика, экономика, политика). Учет закономерности изменения эффективности накопления сигнала позволяет свести к минимуму потери от влияния помех на процесс принятия решения.
Установление этой закономерности позволило предложить новый метод «покаскадного» накопления сигнала [5], который органично вписывается в существующие иерархические структуры обнаружения сигналов и обработки информации.
О степени фундаментальности установленной закономерности можно судить и по разнообразию предметных областей, где она проявляется [10]. Установленной закономерности подчиняются все каналы передачи, воспроизведения (хранения) и обработки информации независимо от их физической природы (технические, биологические, социальные) и функционального назначения.
Список литературы
ДруяновЛ.А. Законы природы и их познание. – М.: Просвещение, 1982. – 112с.
Неймана – Пирсона лемма // Математическая энциклопедия Т. 3 Коо – Од / Гл. ред. И.М.Виноградов. – М.: Советская Энциклопедия, 1982. – 1184 стб.
ГоссенИ.И., КолотушинаС.П., ТыминскийВ.Г. Физику о научном открытии. – Томск: Томский университет, 1984. – 103с.
ВанТрисГ. Теория обнаружения, оценок и модуляции. Т.1. – М.: Сов. радио, 1972. – 744с.
РучкинВ.А. Закономерность изменения эффективности накопления сигнала двоичного кода. – Киев 1999. Деп. в ГНТБ Украины 01.09.1999, №235 – Ук 99.
РучкинВ.А. Методика автоматизированного нахождения оптимального решения задачи проверки простой гипотезы против простой альтернативы / Киев. воен. ин-т. упр. и связи. Киев. 1997. Деп. в ГНТБ Украины 06.02.97 №154 – Ук 97.
РучкинВ.А. Номограмма для определения количественных соотношений между вероятностью ложной тревоги и вероятностью правильного обнаружения сигнала // Труды КВИРТУ – К.: Киевское высш. инж. р-т училище ПВО, 1968, №44 – с. 57...61.
РучкинВ.А. Скорректированное отношение правдоподобия и эффективность его использования при проверке простой гипотезы против простой альтернативы. Киев. воен. ин-т. упр. и связи. – Киев, 1997. Деп. в ГНТБ Украины 12.06.97 №359 – Ук 97.
РучкинВ.А. Статистический критерий оптимальной обработки сигналов для нового поколения систем обнаружения и измерения. Киев. воен. ин-т. упр. и связи. – Киев. 1998. Деп. в ГНТБ Украины 14.12.1998, №488 – Ук 98.
РучкинВ.А. Основные области приложения знаний о закономерности изменения эффективности накопления сигнала двоичного кода. Киев. воен. ин-т. упр. и связи. – Киев, 1999. Деп. в ГНТБ Украины 1.09.99 №234 – Ук 99.