Business Engineering Group | Главная страница Бизнес Инжиниринг Групп | Главная страница Написать письмо Написать письмо Карта сервера Карта сайта
Бизнес Инжиниринг Групп
ЧаВо Форум Контакты Прайс
ЧаВо
Форум
Контакты
Прайс
О фирме
Консалтинг
Обучение
Инструменты
Клиенты
е-Государство
Теория
Публикации
Персонал

Вакансии

Клиенты и проекты

Отзывы о нас

Награды и дипломы

Лицензии и сертификаты

Партнеры

Культурный раздел

Новости

Семинары/Конференции/Выставки (анонс будущих)
Семинары/Конференции/Выставки (отчеты по прошедшим)
Новые и завершенные проекты/этапы
Новости продукта и технологий
Новые публикации
Новости сайта
Новости компании
Прочее
Контакты

Задайте нам вопрос

Имя:

Компания:

Телефон:

E-mail:

Вопрос:
Введите число на рисунке:
Ближайшие семинары
Управление процессами и реинжиниринг. Как это делают сегодня? Новейшие технологии на семинарах «Бизнес Инжиниринг Групп»
подробнее подробнее...
Главная | О компании | Новости | Семинары/Конференции/Выставки (отчеты по прошедшим)

УДК 004.82

ВИЗУАЛЬНЫЙ ЯЗЫК КЛАССИФИКАТОРОВ И ПРОЕКЦИЙ ДЛЯ РАЗРАБОТКИ БАЗ ЗНАНИЙ

Д.В. Кудрявцев (dmitry.ku@gmail.com)
Санкт-Петербургский Государственный Политехнический Университет, Санкт-Петербург

Л.Ю. Григорьев (griglev@gmail.com)
Бизнес Инжиниринг Групп, Санкт-Петербург

В работе предлагается язык визуального проектирования и наполнения онтологий для разработки баз знаний. Также в статье приводится схема соответствия предложенного языка элементам языка OWL, иллюстрируется программная реализация языка в системе ОРГ-Мастер, а также описываются результаты внедрения системы в бизнесе и органах государственной власти.

Введение

В настоящее время одним из основных компонентов баз знаний являются онтологии [Гаврилова, 2001; Davis et al, 2003]. Для представления онтологий в базах знаний используются специальные языки: RDFS [Brickley Guha, 2004], OWL [Dean, Schreiber, 2004], Gellish [Van Renssen, 2005], CycL [CycL, 2002]. Указанные языки эффективны для решения задач автоматизированной интеграции информации, обмена (interchange) знаниями и выполнения логического вывода (reasoning). Однако для работы разработчика и пользователя базы знаний требуется визуальное представление онтологий, которое может быть реализовано как с помощью специальных визуальных языков (IDEF5 и др.), так и с помощью методов визуализации онтологий, представленных в стандартных машиночитаемых языках [Katifori et al, 2007].

Проблема существующих визуальных методов представления онтологий заключается в том, что основной акцент в них сделан на задаче проектирования онтологии, а важность формата представления знаний для наполнения онтологии экземплярами недооценивается и отдается на откуп разработчикам редакторов онтологий и баз знаний. В результате этого при разработке масштабных баз знаний (более 1000 элементов) в существующих инструментах возникают сложности при наполнение онтологий.

В статье предлагается язык классификаторов и проекций для визуальной разработки баз знаний на основе онтологий, в котором в явном виде задается формат для визуальной работы с экземплярами онтологии.

1. Обзор визуальных методов представления онтологий

В работе [Гаврилова, Гулякина, 2008] был представлен комплексный обзор визуальных методов работы со знаниями, в котором онтологии были указаны в качестве одного из способов визуального структурирования знаний. Для визуального представления онтологий могут использоваться специальные визуальные языки, а также методы визуализации онтологий, представленных в стандартных машиночитаемых языках.

1.1. Визуальные языки представления онтологий

В рамках методологии IDEF для построения онтологий был создан язык IDEF5 [Верников, 1999], который включает в себя 2 специальных онтологических языка: схематический язык (Schematic Language-SL) и язык доработок и уточнений (Elaboration Language-EL). SL является наглядным графическим языком, специально предназначенным для изложения компетентными специалистами в рассматриваемой области системы основных данных в форме онтологической информации. Этот язык позволяет естественным образом представлять основную информацию в начальном развитии онтологии и дополнять существующие онтологии новыми данными. EL представляет собой структурированный текстовой язык, который позволяет детально характеризовать элементы онтологии. Основная цель всех этих диаграмм - наглядно и визуально представлять основную онтологическую информацию. Хотя стандарт IDEF5 и создавался специально для графического моделирования онтологий, однако, он имеет очень мало инструментальных средств поддержки и, соответственно, существующих способов взаимодействия с другими методологиями.

Язык UML [Буч и др., 2001] используется для объектно-ориентированного моделирования при разработке информационных систем. Диаграмма классов данного языка традиционно используется для разработки и представления онтологий. Диаграмма классов определяет типы классов системы и различного рода статические связи, которые существуют между ними. На диаграммах классов изображаются также атрибуты классов, операции классов и ограничения, которые накладываются на связи между классами.

Разработчиками системы для работы с концептуальными картами (cmap.ihmc.us) предложено визуальное представление синтаксиса языка OWL c помощью шаблонов, интегрированных в редактор концептуальных карт [Hayes et al, 2005]. Данный визуальный язык представления онтологий реализован в Concept-map Ontology Environment (cmap.ihmc.us/coe/).

1.2. Обзор методов визуализации онтологий

Детальный обзор методов визуализации онтологий сделан в работе [Katifori et al, 2007], в рамках которой выделяется 6 категорий методов визуализации онтологий и рассматриваются из достоинства и недостатки:

Иерархический список (Indented List): многие инструменты визуализации онтологий, в том числе Protege, OntoEdit, Kaon и некоторые другие, предлагают в качестве основного способа визуализации представления в стиле Проводника в Windows. При этом таксономия онтологии представляется как дерево.

Узлы-связи и деревья (Node–link and Tree): методы этой категории отображают онтологию как набор соединяющихся узлов, представляющих иерархию классов в виде вертикально- или горизонтально-размещенного дерева. Пользователю обычно предоставляется возможность разворачивать и сворачивать узлы и поддеревья для управления детализацией информации. 2-х мерная реализация данного метода осуществляется в OntoViz, IzaVis, SpaceTree, 3-х мерная в OntoSphere.

Масштабируемые (Zoomable): методы данной категории отражают иерархию классов и экземпляры через визуальную вложенность объектов (диаграммы Вена, «меньшие коробочки размещаются в больших»). При выборе объекта он увеличивается в размере (zoom-in), позволяя более детально рассмотреть свои компоненты (подклассы и экземпляры). Примеры систем и соответствующих методов: Grokker, Jambalaya, CropCircles.

Заполнение пространства (Space-filling): идея данной группы методов заключается в использовании всего пространства экрана путем разделения пространства каждого узла между его потомками в зависимости от свойств узла, например, количества потомков и т.п. Примеры: TreeMaps, Information Slices.

Фокусирование+контекст (Focus + Context): данная группа техник основана на понятии искажения (distorting) графа с целью фокусировки на определенном узле и представления его контекста (окружении). Фокусный узел отображается в центре, а связанные с ним элементы располагаются вокруг него и их размер уменьшается по мере удаления от фокуса. Для увеличения какого-либо узла пользователь должен сделать его фокусным.

Примеры: Touchgraph / TGVizTab (2-х мерный), 3D Hyperbolyc Tree.

Трёхмерные информационные ландшафты (3D Information Landscapes).

По результатам обзора можно сделать заключение, что в настоящий момент отсутствует визуальный язык или метод представления онтологии, который может быть использован как на этапе разработки онтологии, так и на этапе ее наполнения, который обеспечит также машинную обработку онтологий и позволит работать с масштабными онтологиями (более 1000 элементов).

2. Описание визуального языка классификаторов и проекций для разработки баз знаний

Визуальный язык классификаторов и проекций содержит следующие элементы:

L :: = <TYPES, CL, PR, TASKS, SPEC >, где:

TYPES – описание типов, позволяющее представить таксономию верхнеуровневых классов, типы связей между классами, значения свойств классов. Каждому типу ставится в соответствие пиктограмма (графический знак).

CL – классификатор, формат ввода нижнеуровневых классов и экземпляров онтологии, их свойств и иерархических связей между ними. Основные типы связей: «класс-подкласс», «часть-целое», «подчиняется» и т.п.;

CL= {CLiname, Onto-CLi, Base-CLi} – классификатор, где CLiname – имя классификатора; Onto-CLi – свойства классификатора – часть классификатора, задающая состав типов элементов, перечисляемых в классификаторе, перечень их свойств с областями допустимых значений и типы иерархических связей между элементами; Base-CLi – содержание классификатора – часть классификатора, в которой перечисляются и типизируются моделируемые нижнеуровневые классы, значения их свойств и задается древовидная система связей между классами.

PR – проекция, формат ввода связей между экземплярами онтологии, перечисленными в классификаторах. Примеры типов связей: «выполняет», «обеспечивает достижение», «отвечает за»;

PRj = {PRjname, Onto-PRj, Base-PRj} – проекция, где PRjname – наименование проекции; Onto-PRj – свойства проекции – часть проекции, определяющая состав связей между типами, перечисляемых в классификаторе элементов; Base-PRj – содержание проекции – часть проекции, содержащая множество связей между элементами, связываемых классификаторов.

TASKS – формат спецификации задач по разработке и использованию онтологии (не рассматривается в рамках данной статьи);

SPEC – формат спецификации запросов к онтологической модели (не рассматривается в рамках данной статьи).

Данный язык используется для структурирования и представления знаний, а также для формирования запросов к онтологической модели.

3. Схема соответствия элементов языка классификаторов и проекций компонентам языка OWL

Табл. 1.

Элементы предложенного языка

Элементы OWL

TYPES

e-typei + sign

owl:Class + rdfs:label(пиктограмма)

pt-typek+ sign

owl:DatatypeProperty + rdfs:label(пиктограмма)

rel-typej+ sign

owl:ObjectProperty + rdfs:label(пиктограмма)

(«является», e-typei1, e-typei2)

rdfs:subClassOf (owl:Class, owl:Class)

rdfs:subPropertyOf

CL

Onto-CL

typeCli

owl:Class ИЛИ owl:DatatypeProperty ИЛИ 

owl:ObjectProperty

{(typeCLi, pt-typek, pt-typeVALk)}

owl:DatatypeProperty (rdfs:domain, rdfs:range)

{(rel-typej, typeCLi1, typeCLi2)}

owl:ObjectProperty (rdfs:domain, rdfs:range)

граф, создаваемый на основе указанной связи должен быть деревом

Base-CL

{ECli} – элементы классификатора

rdf:ID (Индивиды) ИЛИ owl:DatatypeProperty ИЛИ owl:ObjectProperty

(«имеет тип», ECLi, e-typei)

rdf:type(Ei, C0i)

(rel-typej, ECi1, ECi2)

owl:ObjectProperty (E1, E2)

получаемый граф, должен быть деревом

PR

Onto-PR

(rel-typej, typeCLi1, typeCLi2,)

owl:ObjectProperty (rdfs:domain, rdfs:range)

Иногда: owl:DatatypeProperty (rdfs:domain, rdfs:range)

Base-PR

(rel-typej, ECi1, ECi2,)

owl:ObjectProperty (E1, E2)

Иногда: owl:DatatypeProperty (E1, E2)

4. Программная реализация языка классификаторов и проекций в системе ОРГ-Мастер

Язык визуального проектирования и наполнения баз знаний реализован в системе ОРГ-Мастер.

Рис. 1. Типы (TYPES) для разработки и визуализации верхнеуровневых классов

Рис. 2. Пример классификатора (CL) бизнес-процессов предприятия

При создании нижнеуровневой онтологии (левая окно на рис. 2) происходит типизация элементов с помощью верхнеуровневой онтологии (правое окно на рис. 2). С точки зрения механизма визуализации, устанавливается связь между элементами 2-х иерархических списков.

Для визуализации перекрестных связей между классами используются проекции. Связи в проекции могут быть направленными и ненаправленными, типизированными и нетипизированными.

Рис. 3. Пример проекции (PR), связывающей бизнес-процессы предприятия с целями

5. Внедрение

Предложенный язык и технология визуального проектирования баз знаний используется для представления знаний о предприятии или органе государственной власти в задачах проектирования его организационной структуры, оптимизации бизнес- или административных процессов и формирования организационно-нормативной документации (регламенты деятельности, положения о подразделениях, должностные инструкции) [Григорьев, Кудрявцев, 2008].

с использованием системы разработано более 10 административных регламентов для Федеральной миграционной службы, Федеральной регистрационной службы, Федерального агентства по физической культуре и спорту, Федеральной службы по труду и занятости и других организаций. Коммерческими организациями-пользователями системы являются: Бизнес-Инжиниринг Групп, группа предприятий ГОТЭК, «Группа «Илим», Киришская ГРЭС, ЗАО «Евросиб», ОАО «Иркутскэнерго», ОАО «Газаппарат», «АСТРА Холдинг», Торговый дом «Петровский», Холдинг ПЕКАР и др.

Разработкой и сопровождением модели предприятия (базы знаний) занимаются пользователи бизнес-аналитики, не владеющие специальными знаниями в области представления знаний.

Масштаб создаваемых моделей достигает десятков тысяч элементов, например, классификатор функций на одном из предприятий включал более 20 000 позиций.

6. Заключение

Предложенный в статье визуальный язык представления онтологий основан на использовании иерархических списков [Katifori et al, 2007] и связей между списками. Иерархические списки используются как для представления классов, так и для представления экземпляров.

Основные преимущества визуализации иерархическим списком – простота реализации и привычность для пользователя, поскольку такой же подход используется в многочисленных файловых браузерах (Проводник Microsoft Windows, Total Commander…). Данный метод дает ясное представление имен классов и их иерархии. В отличие от других методов визуализации, в иерархическом списке имена классов не перекрывают друг друга и чтобы их увидеть не нужно наводить курсор на соответствующий объект. Возможность свернуть/развернуть узел – полезное свойство для рассмотрения определенной части иерархии, особенно для масштабных онтологий. Простота таких интерфейсов делает их удобными для быстрого обзора. Основная проблема визуализации иерархическим списком – представление только древовидных структур, но не сетевых. В существующих редакторах онтологий, использующих визуализацию иерархическим списком, нет визуализации перекрестных связей. Они видны только как слоты классов. Однако данная проблема устранена в предложенном языке и технологии визуализации с помощью специального конструкта – проекции.

Таким образом, предлагаемый способ визуализации онтологии позволяет устранить главный недостаток использования иерархических списков, сохранив его преимущества. По простоте и наглядности разработанный инструмент близок средствам когнитивного моделирования (mindmappers, concept mappers), а по объему явно представленной семантики приближается к редакторам онтологий.

Список литературы

  • [Буч и др., 2001] Буч Г., Рамбо Д., Джекобсон А. UML: Руководство пользователя. – М. : ДМК Пресс, 2001.
  • [Верников, 1999] Верников Г. Стандарт онтологического исследования IDEF5. 1999. http://citforum.ncstu.ru/cfin/idef/idef5.shtml
  • [Гаврилова, 2001] Гаврилова Т.А. Использование онтологий в системах управления знаниями // Труды международного конгресса «Искусственный интеллект в XXI веке», Дивноморское, Россия, М., Физматлит, 2001. - c.21-33.
  • [Гаврилова, Гулякина, 2008] Гаврилова Т.А., Гулякина Н.А. Визуальные методы работы со знаниями: попытка обзора // Искусственный интеллект и принятие решений. 2008. № 1. С. 15-21.
  • [Григорьев, Кудрявцев, 2008] Григорьев Л. Ю., Кудрявцев Д. В. Автоматизированная система поддержки организационного проектирования на основе онтологий // Труды Международной конференции AIS/CAD '08, 3-10 сентября 2008 г., пос. Дивноморское, Россия. – М.: Физматлит, 2008. – С. 129-136.
  • [Brickley Guha, 2004] Brickley, D. Guha R.V. RDF Vocabulary Description Language 1.0: RDF Schema W3C Recommendation 10 February 2004 http://www.w3.org/TR/rdf-schema/
  • [CycL, 2002] СycL http://www.cyc.com/cycdoc/ref/cycl-syntax.html
  • [Davis et al, 2003] Davies J. (Editor), Fensel D. (Editor), van Harmelen F. (Editor), 2003 Towards the Semantic Web: Ontology-driven Knowledge Management, John Wiley and sons Ltd: England.
  • [Dean, Schreiber, 2004] Dean M., Schreiber G. (eds), van Harmelen F., Hendler J., Horrocks I., McGuinness D., Patel-Schneider P., Stein L., OWL Web Ontology Language Reference. http://www.w3.org/TR/owl-ref/ Перевод: Дмитрий Щербина. OWL, язык веб-онтологий. Руководство. Рекомендация W3C 10 февраля 2004. http://sherdim.rsu.ru/pts/semantic_web/REC-owl-guide-20040210_ru.html
  • [Hayes et al, 2005] Hayes P., Eskridge T., Saavedra R., Reichherzer T., Mehrotra M., Bobrovnikoff D. Collaborative knowledge capture in ontologies. K-CAP 2005. P. 99-106.
  • [Katifori et al, 2007] Katifori A., Halatsis C., Lepouras G., Vassilakis C., Giannopoulou E. Ontology visualization methods - a survey. ACM Comput. Surv. 39(4): (2007).
  • [NeOn] http://www.neon-project.org/nw/About_NeOn
  • [Van Renssen, 2005] Van Renssen, A.. Gellish: A Generic Extensible Ontological Language. Delft University Press, 2005. http://www.gellish.net/
Ждем ваших звонков:
+7 (812) 6703162
191015, Россия, Санкт-Петербург,
Фуражный пер., д.3
© 1999-2019 Бизнес Инжиниринг Групп
Написать письмо в службу поддержки сайта Бизнес Инжиниринг Групп
admin@bigc.ru www.bigc.ru  
  Рейтинг@Mail.ru
Главная Новости Контакты Поиск Персональный раздел
© 2006-2007 Разработка сайта - компания Lenvendo Работает на “1С-Битрикс: Управление сайтом”