Государственный комитет Российской Федерации
по Высшему Образованию
Московский государственный институт радиотехники,
электроники и автоматики
(Технический университет)
факультет: Кибернетики
кафедра: ИТС
Курсовой проект
по дисциплине: Инженерия Знаний
на тему: Представление и использование знаний об объектах.
Представление и использование знаний об отношениях между объектами. Организация обобщенной информации на основе использования мультииерархической таксономической структуры.
группа разработчиков: Частухин Виталий
Рыбина Марина
Юданова Ирина
группа: АИ-1-93
руководитель: Потресова Галина Дмитриевна
Москва 1996
Содержание
Задание.............................................................................................................3
Введение...........................................................................................................4
Формулировка цели КПР..............................................................................4
1. Теоретический раздел.................................................................................5
2. Практический раздел................................................................................24
2.1 Ограничения на использование
разработанного программного обеспечения........................................24
2.2 Необходимые знания для работы в MS ACCESS2.0.
Краткий экскурс в Access..........................................................................24
2.3 Планирование БД...................................................................................27
2.4 Создание таблиц для ваших данных....................................................29
2.5 Ввод данных в ваши таблицы..............................................................33
2.6 Связи между таблицами.........................................................................33
3. Варианты заданий по л.р.........................................................................35
4. Содержание отчета о л.р..........................................................................36
5. Контрольные вопросы.............................................................................36
6. Выполнение л.р. для одного из вариантов задания.............................36
Заключение.....................................................................................................39
Библиографический список..........................................................................40
Задание на КПР
по дисциплине: Инженерия Знаний
студентам: Частухину Виталию, Рыбиной Марине,
Юдановой Ирине, группа: АИ-1-93
на тему: Представление и использование знаний об объектах.
Представление и использование знаний об отношениях между объектами. Организация обобщенной информации на основе использования мультииерархической таксономической структуры.
1. Перечень разрабатываемых вопросов
1.1 Формулировка цели КПР
1.2. Составление вариантов заданий и определение порядка выполнения л.р.
1.3 Составление библиографического списка по тематике КПР
1.4 Подготовка теоретического материала по тематике КПР
1.5 Составление контрольных вопросов
1.6 Разработка методики выполнения практической части работы
1.7 Определение содержания отчетов о работе
1.8 Разработка необходимого программного и информационного
обеспечения,необходимого для выполнения л.р.
1.9 Выполнение и оформление л.р. для одного ищз вариантов задания
2. Календарный план - график
2.1 Пункты 1.1, 1.2, 1.3 к 20.02
2.2 Пункты 1.4, 1.5 к 5.03
2.3 Пункты 1.6, 1.7 19.03
2.4 Пункт 1.8 к 9.04
2.5 Пункт 1.9 к 16.04
3. Задание выдано 13.02.96 г.
Введение
За последние тридцать лет теория баз данных (БД) стала одним из основных разделов информатики, оказывающим сильное воздействие на развитие архитектуры вычислительных систем, современную информационную технологию и методологию проектирования автоматизированных информационных систем (АИС), особенно банков данных (БнД). В последние годы в теории БД сложилось новое направление научных исследований, получившее название семантического, или концептуального, моделирования в БД. Его основная цель - интеллектуализация банков данных и организация интерфейса конечного пользователя с информационной системой на уровне представлений о предметной области, а не на уровне структур данных.
Первоначально в теории БД основное внимание уделялось средствам эффективной организации данных и манипулирования ими. Так возникли получившие всеобщее распространение три "великих", по выражению Дж. Ульмана, модели данных: иерархическая, реляционная и сетевая. Одновременно стало ясным, что эффективность новых информационных систем - банков данных - зависит не только от характеристик технических средств и программного обеспечения, но и от эффективности взаимодействия человек - машина. Перенос акцента на конечного пользователя и привел в конечном счете к формированию нового направления исследований в теории БД, непосредственно связанного с задачей о представлении знаний.
В настоящее время определился основной подход к решению задач семантического моделирования в базах данных. Он заключается в выделении двух уровней моделирования: уровня концептуального моделирования ПО (предметной области) и уровня моделирования собственно базы данных. На верхнем уровне осуществляется переход от неформализованного описания ПО и информационных потребностей конечного пользователя к их формальному выражению с помощью специальных языковых средств. Обсуждению возможных конструкций концептуальной модели ПО посвящен теоретический раздел данного курсового проекта.
Формулировка цели КП
Целью данного курсового проекта является разработка теоретического и практического материала для обеспечения доступного изучения соответствующих разделов по дисциплине Инженерия Знаний, а именно: представления знаний об объектах, представлении и использовании знаний об отношении между объектами, а также организации обобщенной информации на основе использования мультииерархической таксономической структуры. Практические разработки данного КП (структуры баз данных в СУБД Microsoft Access 2.0, а также приведенная методика создания этих структур в Access 2.0) могут являться материалом для выполнения лабораторных работ по дисциплине Инженерия Знаний при условии наличия необходимых технических средств.
1. Теоретический раздел
Инженерия знаний - область информатики, в которой исследуются методы представления знаний, манипулирования ими и поддержания их в актуальном состоянии.
Информационная система - организованная совокупность технических и обеспечивающих средств, технологических процессов и кадров, реализующих следующие основные функции:
-сбор информации;
-хранение информации;
-поиск и обработка информации;
-передача информации;
Модель ПО
(понятийное знание)
Система управления
базами знаний
Пакеты База данных
прикладных
программ
(процедурные
знания) Предметное знание
рис.1
Краеугольным камнем исследований последнего времени является понятие "предметная область банка данных" (ПО) (enterprise, universe of discourse).
Совокупность объектов, о которых можно задавать вопросы, образует объектное ядро предметной области. Здесь слово "объект" употреблено как синоним слова "реалия"; не предполагается, что объекты обязательно имеют материальную, "вещную" природу. Термин "объект" также является первичным, неопределяемым понятием. (См. рис.2а) Синонимами, помимо употребленного выше слова "реалия", служат слова "сущность" (entity), "вещь" (thing). Примеры объектов - отдельный студент, группа студентов, аудитория, время занятий, слова, числа и т.д. Обычно считается, что быть объектом - значит быть дискретным и различимым. По - видимому, примеры "необъектов" - это мир, время, материя, смысл и т.п., хотя можно представить ИС, в которой хранятся сведения об этих категориях.
Объект Предмет
первичное
неопределяемое модель объекта
понятие
в качестве объектов
могут быть
абстракция
не только физические,
но и объекты
мышления
рис. 2а рис.2б
Часто слово "объект" считается близким по смыслу слову "предмет". Однако представляется удобным слово "предмет" использовать в том случае, когда объект, существующий вне нас, становится носителем определенной совокупности свойств и входит в различные взаимоотношения, которые представляют интерес для потребителей информации, хранящейся в АИС. Другими словами, предмет - это объект, ставший объектом рассмотрения, наблюдения, ставший носителем определенных свойств. Один и тот же объект воспринимается разными системами как разные предметы. Предмет является результатом абстракции реального объекта, результатом огрубления действительности, при котором игнорируется бесконечное многообразие свойств и взаимодействий объекта. Таким образом, предмет - это модель реального объекта: если объект имеет онтологический статус, то предмет - гносеологический. (См. рис.2б)
Объекты могут быть простыми и сложными. Простыми называются объекты, которые для данной предметной области считаются бесструктурными. Простые объекты представляются совокупностью характеризующих их свойств. Внутренняя структура простого объекта не раскрывается.
Сложные объекты имеют определенный состав и структуру. Например:
Студент Иванов учится в группе АИ-2-93
Способы идентификации объектов:
1. Прямая идентификация. Основана на использовании имен объектов.
2. Косвенная идентификация. Основана на указании свойств объекта. В БД косвенная идентификация основывается на использовании ключей.
Ключ - набор полей записи, значения которых однозначно определяют запись файла.
В конкретный момент времени состояние предметной области определяется совокупностью объектов и ситуаций, имеющих место в данный момент времени.
Пространство состояний предметной области - это класс всех возможных конечных множеств объектной и системной предметной области.
Для описания динамики предметной области нужно рассмотреть траекторию предметной области в пространстве состояний.
Семантика предметной области определяется как общее свойство всех возможных траекторий в пространстве состояний.
На рис.3 предложена классификация ситуаций. Эта классификация рассматривает свойства как специальный случай ситуаций. Одновременно она вводит еще одно важное понятие - понятие времени, которое явно или неявно присутствует при выделении подклассов указанной иерархии. Время выступает как множество отдельных моментов и как множество интервалов (временное состояние, негомогенный процесс). В явном виде структуры этих множеств не фиксированы, хотя отношение следования между моментами времени считается известным.
Следует различать реальное время внешнего мира и его отражение в ИС и в источниках информации. Внутри системы зависящие от времени взаимосвязи фокусируются только после их регистрации источниками и передачи сообщений информационной системе.
Другое понятие, также неявно участвующее в указанной классификации, - это понятие пространства. "Постоянными являются все свойства и соотношения, вытекающие из принадлежности объектов к той или иной таксономической категории..., свойства типов объектов, а также отношения кровного родства, неотъемлемой принадлежности, относительное расположение неподвижных предметов ..., свойства и отношения абстрактных объектов, не локализованные в пространстве". В приведенном высказывании хочется обратить внимание еще на два обстоятельства: для лингвиста несомненно наличие таксономических категорий объектов, которые обладают собственными свойствами, и наличие общих свойств у объектов одной таксономической категории. Эти само собой разумеющиеся обстоятельства широко используются в семантических моделях баз данных.
ситуации
статические динамические
состояния постоянные процессы события
свойства и
отношения
устойчивые временные результаты происшествия
рис.3
Ситуации сами являются объектами, поэтому могут обладать различными свойствами.
Введя пространство состояний, можно рассматривать в нем определенные траектории или последовательности состояний g0, g1, ..., gt, ... , в которых находится ПО в моменты времени 0, 1, ..., t, ... Члены такой последовательности не могут быть совершенно произвольными, поскольку состояние gt обычно как - то связано с предшествующими состояниями g0, g1, ..., gt-1. Поэтому предметную область можно определить как класс всех действительно возможных последовательностей состояний. Такие последовательности называются траекториями ПО. Совокупность всех общих свойств траекторий называется семантикой предметной области.
Итог проведенных рассмотрений подведем следующей диаграммой, классифицирующей объекты в предметной области и дополняющей рис.3.
Объекты ПО
материальные нематериальные
имена понятия ситуации
рис.4
Концептуальные средства описания предметной области
Эти средства обладают абстрактностью и универсальностью. В силу своей абстрактности средства описания стали называться концептуальными. Универсальность определяется общностью систем базовых понятий и средствами порождения новых понятий.
В исследованиях по искусственному интеллекту проблема описания предметной области трактуется как проблема представления знаний, а соответствующие концептуальные средства называются схемой представления.
В теории БД принято говорить о концептуальном, или информационно - логическом, моделировании ПО. Центральным понятием является понятие концептуальной схемы (модели) ПО.
В силу свойства универсальности, описать средства построения концептуальной схемы - это значит описать возможные состояния абстрактной предметной области, которая предназначена для моделирования структуры и динамики произвольных ПО.
Понятия:
1. Тип объекта - должен иметь уникальное имя и все объекты предметной области могут быть отнесены к одному или нескольким типам.
t0 - тип объекта;
t0t - множество объектов типа t в момент времени t;
Эти множества могут пересекаться, если объект имеет несколько типов.
Тип объекта может сообщаться системе при первом упоминании этого объекта.
Тип объекта может определяться системой на основании свойств объекта с помощью классифицирующих процедур.
Тип объекта может быть автоматически изменен при изменении состояния объекта.
2. Концептуальная схема предметной области - множество типов, снабженное некоторой структурой. Структура на множестве типов задается множеством отношений и операций, определенными на множестве типов.
Обозначим j конечные множества объектов предметной области.
Для некоторого момента времени t можно выделить множество объектов типа (t1)obt и (t2)obt, имеющих определенные соотношения, например:
(t1)obt Ì (t2)obt
(t1)obt Ç (t2)obt = 0
Если такие соотношения являются устойчивыми (не меняются во времени), то эти свойства состояния семантической предметной области.
Соотношения:
1. Родовидовое отношение SUP
t1 sup t2 - t1 является подтипом t2 ((вид) является подтипом (род))
Это соотношение задается между типами объектов. Оно верно, если
" t (t1)obt £ (t2)obt
Эти отношения принято задавать графически. Типы объектов представляются вершинами, а отношения между ними - ребрами.
Например:
sup Помещение sup
Учебное Служебное
помещение помещение
sup sup sup sup
аудитория лаборатория помещение помещение
кафедры деканата
рис.5
Следующая диаграмма описывает набор базовых типов объектов для любой концептуальной модели (См. рис. 6).
Объект
sup sup
Неопределенный Определенный
объект sup объект
sup
Материальный Нематериальный
объект объект
sup sup sup sup sup
имя время понятие ситуация пространство
sup sup
статическая динамическая
sup sup
пост. сит. сост.
sup sup
рис.6 уст. сост. врем. сост.
Тип объекта является общим для всех предметных областей.
2. Отношение частичного порядка PART OF. Модель времени строится на основании конечного множества типов временных интервалов, на которых определено отношение PART OF.
ti PART OF tj
явл. частью
Каждый интервал типа ti является частью одназначно определенного интервала tj.
Время
sup sup
год неделя
PART OF PART OF
месяц
PART OF
сутки
PART OF
час
PART OF
минута
PART OF
секунда
рис. 7
Модель пространства строится на конкретном множестве, так же, как и времени, но по отношению к части окрестности.
(См. рис.8)
пространство
sup sup
страна континент
PART OF PART OF
область регион
PART OF PART OF
населенный
пункт
PART OF PART OF
город деревня
рис.8
3. Отношение принадлежности ISA
Иванов А.И. ISA студент
связывает имя объекта с его типом
4. Отношение INSTANCE OF (INS)
Иванов INS АИ-1-93
отношение может быть задано как на
множестве имен, так и типов
name (O1) INS name (O2)
Если t1 INS t,
t2 INS t,
..........
tn INS t, то объект типа t может состоять из объектов
типов t1,t2...tn, причем объект типа t может включать
несколько объектов данных типов.
Это отношение (INS) применяется для множества дискретных объектов,
PART OF - непрерывных.
студент INS группа студентов
лаборатория
INS INS
INS
сотрудники помещение оборудование
лаборатории лаборатории лаборатории
рис.9
Свойства этих отношений
1. PART OF и SUP обладают свойством транзитивности:
t1 SUP t2 ; t2 SUP t3
t1 SUP t3
доцент SUP SUP сотрудник
преподаватель
рис.10
доцент SUP преподаватель ; преподаватель SUP сотрудник
доцент SUP сотрудник
Для отношения INS это свойство не выполняется:
2. t1 INS t2 ; t2 INS t3 ; tn-1 INS tn В графе отношения INS нет
неверно, что tn INS t1 циклов
3. t1 SUP t2 ; t2 INS t3
t1 INS t3
лаборант SUP сотрудник лаборатории ; сотрудник лаборатории INS лаборатория
лаборант INS лаборатория
лаборатория
INS
сотрудник INS
SUP
лаборант
рис.11
4. name (O) ISA t1 ; t1 SUP t2
name (O) ISA t2
Москва ISA город ; город SUP населенный пункт
Москва ISA населенный пункт
Представление типов объектов
Конечное множество троек вида (t, ni, ti);
где t, ti - типы объектов,
ni - имя атрибута,
(Атрибуты - характеристики объектов или роли, которые они играют в определенных ситуациях) i=1,..., к,
ni¹nj, если i¹j, называется представлением типа t, если в каждый момент времени ni: tобt ® (ti)обt,
(ni - отображ. мн-во объектов типа t на мн-во объектов типа t1)
причем разным объектам О1 и О2 типа t соответствуют разные картежи значений функций ni
{n1t(O1), n2t (O1,..., nkt(O1)}
{n1t(O2), n2t(O2,...,nkt(O2)},
последнее условие называется условием различимости объектов.
В качестве примера рассмотрим объект типа автомобиль:
t ni ti
(автомобиль, марка, марка автомобиля)
(автомобиль, номер, номер автомобиля)
(автомобиль, цвет, цвет автомобиля)
автомобиль(москвич, МКА-21-17, белый)
автомобиль(жигули, МВА-11-25, красный)
Композиционный тип объектов
(ni , ti) COMPONENT OF t
COMPONENT OF означает, что объект типа ti является компонентой объекта типа t.
дата
COMPONENT OF
COMPONENT OF COMPONENT OF
год n1 число n3 месяц n2
год t1 число t3 месяц t2
рис.12
Пример композиционного объекта:
Ситуация "находится" (нах. человек в опред. помещении опред. время)
t находится n1 участник ситуации n2 место ситуац